Đồ án Tìm hiểu bài toán làm trơn ảnh - Phạm Việt Thắng
Bạn đang xem 20 trang mẫu của tài liệu "Đồ án Tìm hiểu bài toán làm trơn ảnh - Phạm Việt Thắng", để tải tài liệu gốc về máy bạn click vào nút DOWNLOAD ở trên
Tài liệu đính kèm:
- do_an_tim_hieu_bai_toan_lam_tron_anh_pham_viet_thang.pdf
Nội dung text: Đồ án Tìm hiểu bài toán làm trơn ảnh - Phạm Việt Thắng
- Bé gi¸o dôc vµ ®µo t¹o Tr•êng ®¹i häc d©n lËp h¶i phßng o0o T×M HIÓU BµI TO¸N LµM TR¥N ¶NH ®å ¸n tèt nghiÖp ®¹i häc hÖ chÝnh quy Ngµnh: C«ng nghÖ Th«ng tin Gi¸o viªn h•íng dÉn: PGS.TS §ç N¨ng Toµn Sinh viªn thùc hiÖn: Ph¹m ViÖt Th¾ng M· sè sinh viªn: 110877 H¶i Phßng - 2012 1
- MỤC LỤC MỤC LỤC HÌNH VẼ 4 DANH MỤC CHỮ VIẾT TẮT 5 PHẦN MỞ ĐẦU 6 Chương 1: KHÁI QUÁT VỀ XỬ LÝ ẢNH VÀ LÀM TRƠN ẢNH 1.1. Khái quát về xử lý ảnh 7 1.1.1. Xử lý ảnh 7 1.1.2.1. Thu nhận ảnh (Image acquisition ) 8 1.1.2.2. Tiền xử lý (Image processing) 9 1.1.2.3. Phân đoạn (Segmentation) hay phân vùng ảnh 9 1.1.2.4. Biểu diễn và mô tả (Image representation) 10 1.1.2.5. Nhận dạng và nội suy ảnh (Image Recognition and Interpretation) 10 1.1.2.6. Cơ sở trí thức (Knowledge Base) 11 1.1.2.7. Trích chọn đặc trƣng (Feature extraction) 11 1.1.3. Một số vấn đề cơ bản trong xử lý ảnh 11 1.1.3.1. Điểm ảnh (Picture element) 11 1.1.3.2. Độ phân giải ảnh 12 1.1.3.3. Mức xám của ảnh 12 1.1.3.4. Quan hệ giữa các điểm ảnh 13 1.2. Làm trơn ảnh 15 1.2.1. Bài toán làm trơn ảnh 15 1.2.2. Các kỹ thuật chính đƣợc dùng làm trơn ảnh 16 1.2.2.1. Làm trơn nhiễu bằng lọc tuyến tính 16 1.2.2.2. Làm trơn nhiễu bằng lọc phi tuyến 16 1.2.3. Ứng dụng của làm trơn ảnh 17 Chương 2 : KỸ THUẬT LÀM TRƠN ẢNH 2.1. Làm trơn nhiễu bằng lọc tuyến tính (Linear Filter) 22 2.1.1. Lọc trung bình không gian (Mean Filter, Average Filer) 22 2.1.2. Lọc thông thấp (Low pass Filter) 26 2
- 2.1.3. Lọc đồng hình (Homomorphie Filter) 27 2.1.4. Gaussian Blur 28 2.2. Làm trơn bằng lọc phi tuyến 31 2.2.1. Lọc trung vị (Median Filter) 31 2.2.2. Lọc ngoài (Outlier Filter) 32 2.2.3. Loại bỏ đốm nhiễu Crimmins (Crimmins Speckle Removal) 33 2.2.4. Bộ lọc giữ biên (Kuwahara Filter) 35 Chương 3 : CHƢƠNG TRÌNH THỬ NGHIỆM 3.1. Bài toán 37 3.2. Phân tích và thiết kế 37 3.3. Chƣơng trình làm trơn ảnh v.01 38 PHẦN KẾT LUẬN 43 TÀI LIỆU THAM KHẢO 44 3
- MỤC LỤC HÌNH VẼ Hình 1.1: Quá trình xử lý ảnh 7 Hình 1.2 : Các bƣớc cơ bản trong quá trình xử lý ảnh 8 Hình 1.3: Lân cận các điểm ảnh của tọa độ (x, y) 13 Hình 1.4 :Ví dụ về ứng dụng làm trơn ảnh tích hợp trong camera 17 Hình 1.5: Mô hình hệ thống giám sát giao thông dựa trên công nghệ xử lý ảnh 18 Hình 1.6: Sơ đồ dòng mô tả các tiến trình xử lý của hệ thống 18 Hình 1.7: Giao diện chƣơng trình và kết quả của bài toán tự động giám sát giao thông 19 Hình 1.8: Ảnh siêu âm trong y học 20 Hình 1.9: Ảnh thu đƣợc từ radar (ảnh chỉ mang tính minh họa) 20 Hình 1.10: Ảnh chụp từ vệ tinh (ảnh chỉ mang tính minh họa) 21 Hình 2.1 : Cửa sổ lọc(mặt nạ) có kích thƣớc 5 trong 1D 22 Hình 2.2: Cửa sổ lọc(mặt nạ) có kích thƣớc 3×3 trong 2D 22 Hình 2.3 : Cửa sổ lọc hay mặt nạ kích thƣớc 3×3×3 trong 3D 23 Hình 2.4 : Tính giá trị trung bình 23 Hình 2.5: Cách thức nhân chập điểm ảnh với cửa sổ 24 Hình 2.6 : Trƣờng hợp đặc biệt trong 1D 25 Hình 2.7: Trƣờng hợp đặc biệt trong 2D 25 Hình 2.8: Ví dụ lọc trung bình 26 Hình 2.9 : Gaussian distribution with mean 0 and σ = 1 28 Hình 2.10 : Gaussian distribution with mean (0,0) and σ=1 29 Hình 2.11: Discrete approximation to Gaussian function with σ =1.0 29 Hình 2.12 : Cách thức hoạt động của lọc trung vị 31 Hình 2.13 : Ảnh minh họa Crimmins Speckle Removal 33 Hình 2.14 : Crimmins Speckle removal algorithm 34 Hình 3.1: Giao diện chính của chƣơng trình 38 Hình 3.2: Giao diện modul chọn ảnh đầu vào 39 Hình 3.3: Kết quả của lọc trung vị với cửa sổ 3×3 (ảnh nhiễu muối tiêu) 39 Hình 3.4: Ảnh kết quả của lọc trung bình với cửa sổ 3×3 (ảnh nhiễu muối tiêu) 40 Hình 3.5: Ảnh kết quả của lọc trung vị với cửa sổ 3×3 40 Hình 3.6: Ảnh kết quả của lọc trung bình với cửa sổ 3×3 (ảnh nhiễu cộng) 41 Hình 3.7: Ảnh kết quả của lọc trung vị với cửa sổ 5×5 41 Hình 3.8: Ảnh kết quả của lọc trung bình với cửa sổ 5×5 42 Hình 3.9: Giao diện modul lƣu ảnh (ảnh sau khi xử lý) 42 4
- DANH MỤC CHỮ VIẾT TẮT AD Analog to Digital Ppi Pixel per inch Dpi Dot per inch BMP Bit map Graphics Interchanger Format do hang ComputerServer GIF Incoporated (Mỹ) đề xuất 1990. Joint Photograp Expert Group : tên của nhóm nghiên cứu các chuẩn JPEG nén cho ảnh, thành lâp 1982. Tên cũ là IOS. JPEG chính thức thành lập năm 1986. PEL Picture Elenment JPG Joint Photographic Experts 1D Một chiều (1 Dimention) 2D Hai chiều (2 Dimentions) 3D Ba chiều (3 Dimentions) CNN Mạng nơ ron tế bào (Cellular Neural Network) S – N South – North (Nam – Bắc) E – W East – West (Đông – Tây ) NW – SE North West – South East (Tây Bắc – Đông Nam) NE – SW North East – South West (Đông Bắc – Tây Nam) RGB Hệ màu RGB (Red, Green, Blue) 5
- PHẦN MỞ ĐẦU Thời đại hiện nay là thời đại công nghệ thông tin phát triển bùng nổ đi vào từng ngõ ngách của cuộc sống, bất cứ sự phát triển của ngành công nghiệp nào đều có sự hiện diện và đóng góp to lớn của công nghệ thông tin. Xử lý ảnh là một trong những chuyên ngành quan trọng và lâu đời của công nghệ thông tin. Xử lý ảnh đƣợc áp dụng trong nhiều lĩnh vực khác nhau nhƣ y học, vật lý, hóa học, quân sự, trong giải trí và nhiều lĩnh vực khác Phần lớn con ngƣời thu nhận thông tin bằng thị giác, cụ thể đó là các hình ảnh. Vị vậy xử lý ảnh là vấn đề không thể thiếu và hết sức quan trọng để thu đƣợc hình ảnh tốt hơn, đẹp hơn nhằm đáp ứng yêu cầu thông tin khác nhau của ngƣời nhận. Trong xử lý ảnh, để có đƣợc những bức ảnh nhƣ vậy cần phải trải qua rất nhiều công đoạn, làm trơn ảnh là giai đoạn tiền xử lý rất quan trọng vì nếu không trải qua giai đoạn này ảnh sẽ không đạt đƣợc hiệu quả tối ƣu nhƣ mong muốn. Mục đích của việc làm trơn ảnh là lọc nhiễu và giảm bớt những phần tử (không mong muốn) ảnh hƣởng đến thông tin hữu ích và chất lƣợng của ảnh. Đây là vấn đề đƣợc quan tâm, và hứa hẹn đƣợc áp dụng rộng rãi trong thực tiễn của cuộc sống, đặc biệt là trong giai đoạn đất nƣớc ta đang từng bƣớc phát triển và đi lên nên việc nghiên cứu vấn đề này làrất cần thiết. Xuất phát từ thực tế đó, em lựa chọn đề tài “Tìm hiểu bài toán làm trơn ảnh” với mục đích chính là tìm hiểu một số kỹ thuật làm trơn ảnh, đồng thời cài đặt một chƣơng trình thử nghiệm. Về lý thuyết : - Tìm hiểu khái quát về xử lý ảnh và một số kỹ thuật làm trơn ảnh. - Tìm hiểu một số kỹ thuật làm trơn ảnh trong xử lý ảnh. Về thực tiễn : - Cài đặt thử nghiệm một trong những chƣơng trình tìm hiểu đƣợc. Cấu trúc chính của đồ án gồm 3 chƣơng : Chƣơng 1: Khái quát về xử lý ảnh và làm trơn ảnh Trình bày khái quát về xử lý ảnh và làm trơn ảnh. Chƣơng 2: Kỹ thuật làm trơn ảnh Trình bày một số kỹ thuật làm trơn ảnh phổ biến. Chƣơng 3: Chƣơng trình thử nghiệm Chƣơng trình ứng dụng và một số kết quả thu đƣợc. 6
- Chương 1: KHÁI QUÁT VỀ XỬ LÝ ẢNH VÀ LÀM TRƠN ẢNH 1.1.Khái quát về xử lý ảnh 1.1.1.Xử lý ảnh Con ngƣời thu nhận thông tin qua các giác quan, trong đó thị giác đóng vai trò quan trọng nhất. Những năm trở lại đây với sự phát triển của phần cứng máy tính, xử lý ảnh và đồ hoạ đó phát triển một cách mạnh mẽ và có nhiều ứng dụng trong cuộc sống. Xử lý ảnh và đồ hoạ đóng một vai trò quan trọng trong tƣơng tác ngƣời máy. Quá trình xử lý nhận dạng ảnh là một quá trình thao tác nhằm biến đổi một ảnh đầu vào để cho ra một kết quả mong muốn. Kết quả đầu ra của một quá trình xử lý ảnh có thể là một ảnh “tốt” hơn, hoặc một kết luận. Ảnh “Tốt hơn” Ảnh XỬ LÝ ẢNH Kết luận Hình 1.1: Quá trình xử lý ảnh Nhƣ vậy mục tiêu của xử lý ảnh có thể chia ra làm 3 hƣớng nhƣ sau: - Xử lý ảnh ban đầu để cho ra một ảnh mới tốt hơn theo một mong muốn của ngƣời dung (ví dụ : ảnh nhiễu cần phải lọc nhiễu). - Phân tích ảnh để thu nhận một thông tin nào đó giúp cho giúp cho việc phân loại và nhận biết ảnh. - Từ ảnh đầu vào mà có những nhận xét, kết luận ở mức cao hơn, sâu hơn. (ví dụ: ảnh một tai nạn giao thông phác họa hiện trƣờng ). 7
- 1.1.2.Các bƣớc cơ bản trong xử lý ảnh Hình 1.2 : Các bƣớc cơ bản trong quá trình xử lý ảnh 1.1.2.1. Thu nhận ảnh (Image acquisition ) Đây là bƣớc đầu tiên trong quá trình xử lý ảnh. Để thực hiện điều này ta cần có các thiết bị nhu nhận ảnh bao gồm camera, scanner các thiết bị thu nhận này có thể cho ảnh đen trắng. Các thiết bị thu nhận ảnh có 2 loại chính ứng với 2 loại ảnh thông dụng Raster và Vector. Các thiết bị thu nhận ảnh thông thƣờng Raster là camera, còn các thiết bị thu nhận ảnh Vector là sensor hoặc bộ số hóa (Digitalizer) hoặc đƣợc chuyển đổi từ ảnh Raster. Các thiết bị thu ảnh thông thƣờng gồm camera cộng với bộ chuyển đổi tƣơng tự số AD (Analog to Digital) hoặc scanner chuyên dụng. Các thiết bị thu nhận ảnh này có thể cho ảnh đen trắng hoặc ảnh màu. Đầu ra của scanner là ảnh ma trận số mà ta quen gọi là bản đồ ảnh (ảnh Bitmap). Bộ số hoá (Digitalizer) sẽ tạo ảnh vector có hƣớng. Nhìn chung, các hệ thống thu nhận ảnh thực hiện hai quá trình: - Cảm biến : biến đổi năng lƣợng quang học thành năng lƣợng điện. - Tổng hợp năng lƣợng điện thành ảnh 8
- 1.1.2.2. Tiền xử lý (Image processing) Ở bƣớc này, ảnh sẽ đƣợc cải thiện về độ tƣơng phản, khử nhiễu, khôi phục ảnh, nắn chỉnh hình học Với mục đích làm cho chất lƣợng ảnh trở nên tốt hơn nữa, chuẩn bị cho các bƣớc xử lý phức tạp kế tiếp sau đó. Khử nhiễu: Nhiễu đƣợc chia thành hai loại: nhiễu hệ thống và nhiễu ngẫu nhiên. Đặc trƣng của nhiễu hệ thống là tính tuần hoàn. Do vậy, có thể khử nhiễu này bằng việc sử dụng phép biến đổi Fourier và loại bỏ các đỉnh điểm. Đối với nhiễu ngẫu nhiên, trƣờng hợp đơn giản là các vết bẩn tƣơng ứng với các điểm sáng hay tối, có thể khử nhiễu bằng phƣơng pháp nội suy, lọc trung vị, lọc trung bình. Chỉnh mức xám: Đây là kỹ thuật nhằm chỉnh sửa tính không đồng đều của thiết bị thu nhận hoặc độ tƣơng phản giữa các vùng ảnh. Chỉnh tán xạ: Ảnh thu nhận từ các thiết bị quang học hay điện tử có thể bị mờ, nhòe. Phƣơng pháp biến đổi Fourier dựa trên tích chập của ảnh với hàm tán xạ cho phép giải quyết việc hiệu chỉnh này. Nắn chỉnh hình học: Những biến dạng hình học thƣờng do các thiết bị điện tử và quang học gây ra. Do đó phƣơng pháp hiệu chỉnh hình ảnh dựa trên mô hình đƣợc mô tả dƣới dạng phƣơng trình biến đổi ảnh biến dạng f(x,y) thành ảnh lý tƣởng f(x’,y’) nhƣ sau: Trong đó , là các phƣơng trình tuyến tính (biến dạng do phối cảnh) hay bậc hai (biến dạng do ống kính camera). 1.1.2.3.Phân đoạn (Segmentation) hay phân vùng ảnh Phân vùng ảnh là tách một ảnh đầu vào thành các vùng thành phần (hay còn gọi là các đối tƣợng) để biểu diễn phân tích, nhận dạng ảnh. Ví dụ : Để nhận dạng chữ (hay mã vạch) trên phong bì thƣ cho mục đích phân loại bƣu phẩm, cần chia các câu, chữ về địa chỉ hoặc tên ngƣời thành các từ, các chữ, các số (hoặc các vạch riêng) để nhận dạng. Đây là phần phức tạp khó khăn nhất trong xử lý ảnh và cũng dễ gây lỗi, làm mất độ chính xác của ảnh. Kết quả nhận dạng phụ thuộc rất nhiều vào công đoạn này. 9
- 1.1.2.4.Biểu diễn và mô tả (Image representation) a) Biểu diễn ảnh Đầu ra ảnh sau phân đoạn chứa các điểm ảnh của các vùng ảnh (ảnh đã phân đoạn) cộng với mã liên kết với các vùng lân cận. Việc biến đổi các số liệu này thành dạng thích hợp là cần thiết cho xử lý tiếp theo bằng máy tính. Việc chọn các tính chất để thể hiện ảnh gọi là trích chọn đặc trƣng (Feature Selection) gắn với việc tách các đặc tính của ảnh dƣới dạng các thông tin định lƣợng hoặc làm cơ sở để phân biệt lớp đối tƣợng này với đối tƣợng khác trong phạm vi ảnh nhận đƣợc. Ví dụ : trong nhận dạng kí tự trên phong bì, chúng ta miêu tả các đặc trƣng của từng kí tự giúp phân biệt kí tự này với kí tự khác. b) Mô tả ảnh Ảnh sau khi số hóa sẽ đƣợc lƣu vào bộ nhớ, hoặc chuyển sang các khâu tiếp theo để phân tích. Nếu lƣu trữ ảnh trực tiếp từ các ảnh thô, đòi hỏi dung lƣợng bộ nhớ cực lớn và không hiệu quả theo quan điểm ứng dụng và công nghệ. Thông thƣờng, các ảnh thô đó đặc tả (biểu diễn) lại (hay đơn giản là mã hóa) theo các đặc điểm của ảnh đƣợc gọi là đặc trƣng của ảnh nhƣ : biên ảnh, vùng ảnh. Một số phƣơng pháp biểu diễn thƣờng dung: Biểu diễn bằng mã chạy: Phƣơng pháp này thƣờng biểu diễn cho vùng ảnh và áp dụng cho ảnh nhị phân. Biểu diễn bằng mã xích: Phƣơng pháp này thƣờng dung để biểu diễn các đƣờng biên ảnh. Biểu diễn bằng mã tứ phân: Phƣơng pháp này đƣợc dùng để mã hóa cho các vùng ảnh 1.1.2.5. Nhận dạng và nội suy ảnh (Image Recognition and Interpretation) Nhận dạng ảnh là quá trình xác định ảnh. Quá trình này thƣờng thu đƣợc bằng cách so sánh với mẫu chuẩn đã đƣợc lọc (hoặc lƣu) từ trƣớc. Nội suy là phán đoán theo ý nghĩa trên cơ sở nhận dạng. Ví dụ: một loạt chữ số và nét gạch ngang trên phong bì thƣ có thể đƣợc nội suy thành mã điện thoại. Có nhiều cách phân loại khác nhau về ảnh. Theo lý thuyết về nhận dạng, các mô hình toán học đƣợc phân loại theo hai loại nhận dạng cơ bản: - Nhận dạng theo tham số - Nhận dạng theo cấu trúc 10
- Một số đối tƣợng nhận dạng khá phổ biến hiện nay đang đƣợc áp dụng trong khoa học và công nghệ là: nhận dạng ký tự (chữ in, chữ viết tay, chữ kí điện tử), nhận dạng văn bản (Text), nhận dạng vân tay, nhận dạng mã vạch, nhận dạng mặt ngƣời, 1.1.2.6. Cơ sở trí thức (Knowledge Base) Ảnh là một đối tƣợng khá phức tạp về đƣờng nét, độ sáng tối, dung lƣợng điểm ảnh, môi trƣờng để thu ảnh phong phú kéo theo nhiễu. Trong nhiều khâu xử lý và phân tích ảnh ngoài việc đơn giản hóa các phƣơng pháp toán học đảm bảo tiện lợi cho xử lý, ngƣời ta mong muốn bắt chƣớc quy trình tiếp nhận và xử lý ảnh theo cách của con ngƣời. Trong các bƣớc xử lý đó, nhiều khâu hiện nay đã xử lý theo phƣơng pháp trí tuệ con ngƣời. Vì vậy, ở đây các cơ sở trí thức đƣợc phát huy. 1.1.2.7. Trích chọn đặc trƣng (Feature extraction) Vì lƣợng thông tin chứa trong ảnh là rất lớn, trong khi đó đa số ứng dụng chỉ cần một số thông tin đặc trƣng nào đó, cần có bƣớc trích chọn đặc điểm để giảm lƣợng thông tin khổng lồ ấy. Việc trích chọn hiệu quả đặc điểm giúp cho việc nhận dạng các đối tƣợng ảnh chính xác, với tốc độ tính toán cao và dung lƣợng nhớ lƣu trữgiảm. Các đặc điểm của đối tƣợng đƣợc trích chọn tùy theo mục đích nhận dạng. Có thể nêu ra một số đặc điểm của ảnh sau đây: Đặc điểm không gian: Phân bố mức xám, phân bố xác suất, biên độ, điểm uốn, v.v Đặc điểm biến đổi: Các đặc điểm loại này đƣợc trích chọn bằng việc thực hiện lọc vùng (Zonal Filtering). Các bộ vùng đƣợc gọi là “mặt nạ đặc điểm” (Feature Mask) thƣờng là các khe hẹp với hình dạng khác nhau (chữ nhật, tam giác, cung tròn, ) Đặc điểm biên và đƣờng biên: Đặc trƣng cho đƣờng biên của đối tƣợng và do rất hữu ích trong việc trích chọn các đặc tính bất biến đƣợc dung khi nhận dạng đối tƣợng. Các đặc điểm này có thể đƣợc trích chọn nhờ toán tử Gradien, toán tử Laplace, toán tử chéo không (Zero Crossing) 1.1.3. Một số vấn đề cơ bản trong xử lý ảnh 1.1.3.1.Điểm ảnh (Picture element) Gốc của ảnh (ảnh tự nhiên) là ảnh liên tục về không gian và độ sáng. Để xử lý bằng máy tính, ảnh cần đƣợc số hóa. Số hóa là sự biến đổi gần đúng một ảnh liên tục thành một tập điểm phù hợp với ảnh thật về vị trí (không gian) và độ sáng (mức xám). 11
- Khoảng cách giữa các điểm ảnh đó đƣợc thiết lập sao cho mắt ngƣời không thể phân biệt ranh giới giữa chúng. Mỗi một điểm nhƣ vậy gọi là điểm ảnh (PEL:Picture Element) hay gọi tắt là Pixel. Trong khuôn khổ ảnh hai chiều, mỗi pixel ứng với một cặp tọa độ (x,y). Định nghĩa: Điểm ảnh (Pixel) là một phần tử của ảnh số tại tọa độ (x, y) với độ xám hoặc màu nhất định. Kích thƣớc và khoảng cách giữa các điểm ảnh đƣợc chọn thích hợp sao cho mắt ngƣời cảm nhận về sự liên tục về không gian và mức xám (hoặc màu) của ảnh số gần nhƣ thật. Mỗi phần tử trong ma trận đƣợc gọi là một phần tử ảnh. 1.1.3.2.Độ phân giải ảnh Định nghĩa: Độ phân giải (Resolution) của ảnh là mật độ điểm ảnh đƣợc ấn định trên một ảnh số đƣợc hiển thị. Khoảng cách giữa các điểm ảnh phải đƣợc chọn sao cho mắt ngƣời vẫn thấy đƣợc sự liên tục của ảnh. Việc lực chọn khoảng cách thích hợp tạo nên một mật độ phân bố, đó chính là độ phân giải và đƣợc phân bố theo trục x và y trong không gian hai chiều. Có ba cách để biểu thị độ phân giải của ảnh: Biểu thị bằng số lƣợng điểm ảnh theo chiều dọc và theo chiều ngang của ảnh (ví dụ: 1024×768) Biểu thị bằng tổng số điểm ảnh trên một tấm ảnh (ví dụ: 960.000 pixel) Biểu thị bằng số lượng điểm ảnh có trên 1 inch (ppi) hoặc số chấm(dot) có trên 1 inch (dpi) 1.1.3.3.Mức xám của ảnh Một điểm ảnh (Pixel) có hai đặc trƣng cơ bản là vị trí (x, y) của điểm ảnh và mức xám của nó. Chúng ta xem xét một số khái niệm và thuật ngữ thƣờng dùng trong xử lý ảnh: - Định nghĩa: Mức xám của điểm ảnh là cƣờng độ sáng của nó đƣợc gán bằng giá trị số tại điểm đó. - Các thang giá trị mức xám thông thƣờng: 16, 32, 64, 128, 256 (mức 256 là mức phổ dụng). Lý do từ kỹ thuật máy tính dùng 1 byte (8 bit) để biểu diễn mức xám. Mức xám dùng 1 byte biểu diễn: 28= 256 mức (tức là từ 0 đến 255). 12
- - Ảnh đen trắng: là ảnh có hai màu đen, trắng (không chứa màu khác) với mức xám ở các điểm ảnh có thể khác nhau. - Ảnh nhị phân: Ảnh chỉ có 2 mức đen, trắng phân biệt tức dùng 1 bit mô tả 21 mức khác nhau. Nói cách khác mỗi điểm ảnh của ảnh nhị phân chỉ có thể là 0 hoặc 1. - Ảnh màu: Trong hệ màu RGB (Red, Green, Blue) để tạo nên thế giới màu, ngƣời ta thƣờng dùng 3 byte để mô tả mức màu, khi đó các giá trị màu: 28*3=224≈16,7 triệu màu. 1.1.3.4. Quan hệ giữa các điểm ảnh Một ảnh số giả sử đƣợc biểu diễn bằng hàm f(x, y). Tập con các điểm ảnh là S, các điểm ảnh có quan hệ với nhau ký hiệu là p, q. Chúng ta nêu một số các khái niệm nhƣ sau: a) Các lân cận của điểm ảnh (Image Neighbors) Giả sử có điểm p tại tọa độ (x, y). p có 4 điểm lân cận gần nhất theo chiều đứng và chiều ngang (có thể coi nhƣ lân cận 4 hƣớng chính: Đông, Tây, Nam, Bắc) Trong đó số 1 là giá trị logic, N4(p) tập 4 điểm lân cận của p Hình 1.3: Lân cận các điểm ảnh của tọa độ (x, y) Các lân cận chéo: Các điểm lân cận chéo Np(p) (Có thể coi lân cận chéo là 4 hƣớng: Đông- Nam, Đông- Bắc, Tây- Nam, Tây-Bắc) Tập kết hợp: N8(p)= N4(p) + Np(p) là tập hợp 8 lân cận của điểm ảnh p. Chú ý: Nếu (x, y) nằm ở biên (mép) ảnh, một số điểm sẽ nằm ngoài ảnh. 13
- b) Các mối liên kết điểm ảnh Các mối liên kết đƣợc sử dụng để xác định giới hạn (Boundarie) của đối tƣợng vật thể hoặc xác định vùng trong ảnh. Một liên kết đƣợc đặc trƣng bởi tính liền kề giữa các điểm và mức xám của chúng. Giả sử V là tập giá trị các mức xám. Một ảnh có giá trị cƣờng độ sáng từ thang mức xám từ 32 đến 64 đƣợc mô tả nhƣ sau: V= {32, 33, 34, ,63, 64}. Có 3 loại liên kết: Liên kết 4: Hai điểm ảnh p và q đƣợc nói là liên kết 4 với các giá trị cƣờng độ sáng V nếu q nằm trong một các lân cận của p, tức q thuộc N4(p). Liên kết 8: Hai điểm ảnh p và q nằm trong một các lân cận 8 của p, tức q thuộc N8(p). Liên kết m (liên kết hỗn hợp) : Hai điểm ảnh p và q với giá trị cƣờng độ sáng V đƣợc nói là liên kết m nếu 1. q thuộc N4(p) hoặc 2. q thuộc Np(p) c) Đo khoảng cách giữa các điểm ảnh Định nghĩa: Khoảng cách D(p, q) giữa hai điểm ảnh p tọa độ (x, y) và q tọa độ (s, t) là hàm khoảng cách (Distance) hoặc Metric nếu: 1. D(p, q) ≥ 0 (Với D(p, q)=0 nếu và chỉ nếu p=q) 2. D(p, q) = D(q, p) 3. D(p, z) ≤ D(p, q)+ D(q, z); z là một điểm ảnh khác. Khoảng cách Euclide: Khoảng cách Euclide giữa hai điểm ảnh p(x, y) và q(s, t) đƣợc định nghĩa nhƣ sau: 2 2 1/2 De(p, q) = [(x - s) + (y - t) ] Khoảng cách khối: Khoảng cách D4(p, q) đƣợc gọi là khoảng cách khối đồ thị (City – block Distance)và đƣợc biểu diễn nhƣ sau: D4(p, q)= | x – s | + | y – t | Giá trị khoảng cách giữa các điểm ảnh r: giá trị bán kính r từ tâm điểm ảnh này đến tâm điểm ảnh khác. 14
- Khoảng cách D8(p, q) còn gọi là khoảng cách bàncờ(Chess – Board Distance) giữa điểm ảnh p, q đƣợc xác định nhƣ sau: D8(p, q) = max (| x – s |, | y – t |) 1.2.Làm trơn ảnh 1.2.1.Bài toán làm trơn ảnh Trong hai thập kỉ gần đây, lọc bỏ nhiễu xung là một trong những vấn đề rất đƣợc quan tâm ở lĩnh vực xử lý ảnh. Xuất phát từ nguyên nhân thực tế nhƣ lỗi trong quá trình truyền tải, trục trặc ở bộ phận cảm biến trên thiết bị thu hình kỹ thuật số, Một bộ phận các điểm ảnh (tùy vào tỷ lệ nhiễu) sẽ biến đổi cƣờng độ sáng, dẫn đến chất lƣợng ảnh bị giảm đáng kể. Đối với những hệ thống xử lý ảnh số, việc lọc nhiễu, làm trơn ảnh đƣợc xem là bƣớc tiền xử lý quan trọng và chất lƣợng của giai đoạn này ảnh hƣởng rất lớn đến tính hiệu quả của các xử lý tiếp sau nhƣ: phân đoạn ảnh, nhận dạng đối tƣợng, dò tìm cạnh, hay nói cách khác đó là quá trình nâng cao chất lƣợng ảnh. Nâng cao chất lƣợng ảnh là bƣớc cần thiết trong xử lý ảnh nhằm hoàn thiện một số đặc tính của ảnh. Nâng cao chất lƣợng ảnh gồm hai công đoạn khác nhau: tăng cƣờng ảnh và khôi phục ảnh. Tăng cƣờng ảnh nhằm hoàn thiện các đặc tính của ảnh nhƣ sau : Lọc nhiễu Tăng độ tƣơng phản, điều chỉnh mức xám của ảnh Làm nổi biên ảnh Các thuật toán triển khai việc nâng cao chất lƣợng ảnh hầu hết dựa trên các kỹ thuật trong miền điểm, không gian, tần số. Toán tử điểm là phép biến đổi với từng điểm ảnh đang xét, không liên quan đến các điểm lân cận khác, trong khi đó toán tử không gian sử dụng các điểm lân cận để quy chiếu tới các điểm ảnh đang xét. Một số phép biến đổi có tính toán phức tạp đƣợc chuyển sang miền tần số để thực hiện, kết quả cuối cùng đƣợc chuyển trở lại miền không gian nhờ các biến đổi ngƣợc. Nhƣ đã trình bày ở trên, làm trơn ảnh là một phần trong kỹ thuật tăng cƣờng ảnh của cải thiện ảnh. Làm trơn ảnh thuộc phép biến đổi ảnh-ảnh, phép biến đổi này làm khác biệt giữa các pixel không nhiều. Phép lọc trơn này dùng cho làm mờ ảnh (Blurring) và giảm nhiễu (Noise Reduction). Thƣờng là ảnh thu nhận có nhiễu cần phải loại bỏ hay ảnh không sắc nét bị mờ hoặc cần làm tỏ các chi tiết nhƣ đƣờng biên ảnh. Các toán tử không gian trong kỹ thuật 15
- tăng cƣờng ảnh đƣợc phân nhóm theo công dụng : làm trơn nhiễu, nổi biên. Để làm trơn ảnh hay tách nhiễu, ngƣời ta thƣờng sử dụng các toán tử không gian dùng trong kỹ thuật tăng cƣờng ảnh, điển hình là sử dụng các bộ lọc tuyến tính (lọc trung bình, lọc thông thấp) hay lọc phi tuyến (lọc trung vị, giả trung vị, lọc đồng hình). Từ bản chất của nhiễu (thƣờng tƣơng ứng với tần số cao) và từ cơ sở lý thuyết lọc là : bộ lọc chỉ cho tần số nào đó thông qua, do đó để lọc nhiễu ngƣời ta thƣờng dùng lọc thông thấp (low pass filter) hay lấy tổ hợp tuyến tính để san bằng lọc trung bình (mean filter). Để làm nổi cạnh (ứng với tần số cao) ngƣời ta dùng bộ lọc thông cao (high pass filter), lọc Laplace. Trƣớc khi nói đến các kỹ thuật áp dụng lọc nhiễu, làm trơn ảnh, em xin nói về phân biệt các loại nhiễu trong quá trình xử lý ảnh. Trên thực tế tồn tại nhiều loại nhiễu, tuy nhiên ngƣời ta thƣờng xem xét 3 loại nhiễu chính : nhiễu cộng, nhiễu nhân và nhiễu xung. Nhiễu cộng : Nhiễu cộng thƣờng phân bố khắp ảnh, nếu gọi ảnh quan sát (ảnh thu đƣợc) là Xqs, ảnh gốc là Xgốc, nhiễu là , ảnh thu đƣợc có thể biểu diễn bởi: Xqs = Xgốc + Nhiễu nhân : Nhiễu nhân thƣờng phân bố khắp ảnh, ảnh thu đƣợc có thể biểu diễn bởi: Xqs = Xgốc * Nhiễu xung : Nhiễu xung thƣờng gây đột biến tại một số điểm ảnh. 1.2.2. Các kỹ thuật chính đƣợc dùng làm trơn ảnh 1.2.2.1. Làm trơn nhiễu bằng lọc tuyến tính - Lọc trung bình (Mean Filter) - Lọc thông thấp (Low pass Filter) - Lọc đồng hình (Homomorphie Filter) - Gaussian Blur 1.2.2.2. Làm trơn nhiễu bằng lọc phi tuyến - Lọc trung vị (Median Filter) - Lọc ngoài (Outlier Filter) - Lọc loại bỏ nhiễu đốm Crimmins (Crimmins Speckle Removal) - Bộ lọc giữ biên (Kuwahara Filter) 16
- 1.2.3.Ứng dụng của làm trơn ảnh Xét ở khía cạnh nào đó, ta có thể nói làm trơn ảnh đƣợc ứng dụng khá phổ biến trong nhiều lĩnh vực của đời sống nhƣ giải trí, y học, an ninh và một số lĩnh vực khác Làm trơn ảnh nếu nó đứng riêng lẻ thì hầu nhƣ không có ứng dụng gì ngoài công dụng theo nghĩa đen của nó là làm mịn ảnh, và giảm nhiễu. Nhƣng khi đặt nó vào trong quy trình xử lý thì nó rất quan trọng, kết quả của nó giúp các xử lý phía sau chính xác hơn. Ví dụ nhƣ dò biên với thuật toán canny, trƣớc tiên ngƣời ta sẽ dùng Gaussian để làm mịn ảnh trƣớc giúp lọai bỏ nhiễu nhằm giúp kết quả dò biên tránh đƣợc những sai lầm do nhiễu gây ra. Trong một số trƣờng hợp, các đối tƣợng thông tin có cùng tính chất với nhiễu (điển hình là trong ảnh siêu âm), việc phát hiện đối tƣợng khác thƣờng (detect abnormal object) và loại bỏ chúng trƣớc khi tiến hành các xử lý cao hơn là rất quan trọng. Tùy từng đặc thù ảnh và nhiễu mà ngƣời ta chọn phƣơng pháp, và sử dụng cửa sổ (design kernel) thích hợp nhằm đạt hiệu quả cao nhất là loại bỏ cái cần loại, giữ lại cái cần giữ. Ứng dụng vào công nghệ giám sát “camera lọc nhiễu ba chiều” nhằm tăng cƣờng công tác bảo mật an toàn – an ninh, nếu xảy ra bất cứ một vấn đề hay sự cố gì đều đƣợc camera ghi lại, từ đó làm tƣ liệu, bằng chứng để tìm ra nguyên nhân xảy ra vấn đề. Hình 1.4 :Ví dụ về ứng dụng làm trơn ảnh tích hợp trong camera 17
- Thêm một ứng dụng có sự góp mặt của làm trơn ảnh trong công nghệ giám sát rất đáng đƣợc nhắc đến là “Ứng dụng công nghệ xử lý ảnh thời gian thực trong bài toán tự động giám sát giao thông tại Việt Nam” (đƣợc nghiên cứu bởi KS. Lê Quốc Anh, TS. Phan Tƣơng Lai của Trung tâm KHKT & CNQS cùng với PGS. TS. Lê Hùng Lân, ThS. Nguyễn Văn Tiềm của trƣờng ĐH GTVT Vận Tải). Nghiên cứu này dựa vào sự hỗ trợ tính toán của máy tính thực hiện các thuật toán xử lý ảnh để trích lọc ra các thông tin cần thiết từ chuỗi các ảnh giao thông thu đƣợc bởi camera. Mô hình chung của hệ thống giám sát giao thông bằng công nghệ xử lý ảnh camera đƣợc minh họa nhƣ sau: Hình 1.5: Mô hình hệ thống giám sát giao thông dựa trên công nghệ xử lý ảnh Một hệ thống giám sát giao thông nhƣ vậy sẽ bao gồm các bƣớc xử lý nhƣ tiền xử lý ảnh, phát hiện đối tƣợng trong vùng quan sát của camera, tách đối tƣợng ra khỏi ảnh nền, nhận dạng đối tƣợng và bắt bám đối tƣợng. Mô hình chung của bài toán đƣợc minh họa nhƣ sau: Hình 1.6: Sơ đồ dòng mô tả các tiến trình xử lý của hệ thống Một số hình ảnh kết quả đạt đƣợc của chƣơng trình. Hệ thống chạy thử nghiệm bao gồm 1 camera kỹ thuật số với thông số 25 hình/giây, hệ mầu RGB 24, và kích thƣớc ảnh là 320×240 pixel, 1 máy tính có cấu hình Pentium(R) 4 CPU 2.40 GHz, Ram 128 MB. Camera đƣợc nối ghép với máy tính qua cổng USB. 18
- Hình 1.7: Giao diện chƣơng trình và kết quả của bài toán tự động giám sát giao thông Làm trơn ảnh có ứng dụng rất quan trọng trong y học, chúng ta hãy thử hình dung nếu trong ảnh siêu âm hay chụp nội soi mà xuất hiện những đốm nhiễu, tác động đến phỏng đoán chẩn bệnh của bác sĩ bị sai, dẫn đến phƣơng pháp điều trị sai, hậu quả đe dọa đến sức khỏe, tính mạng con ngƣời quả là vấn đề nghiêm trọng. 19
- Hình 1.8: Ảnh siêu âm trong y học Chúng ta không thể không nhắc đến ứng dụng của làm trơn ảnh trong lĩnh vực quân sự, một trong những vấn đề quan trọng quyết định sự thịnh suy của một quốc gia. Nhũng hình ảnh thu đƣợc từ radar quân sự hay vệ tinh, khi số hóa hoặc gặp sự cố, xuất hiện nhiễu làm ảnh hƣởng thông tin hữu ích trong ảnh, hay có thể gây hậu quả nghiêm trọng. Hình 1.9: Ảnh thu đƣợc từ radar (ảnh chỉ mang tính minh họa) 20
- Hình 1.10: Ảnh chụp từ vệ tinh (ảnh chỉ mang tính minh họa) Hiện nay có các phần mềm làm trơn ảnh phổ biến thì phải kể đến Photoshop, Photilla photo album software 1.0, Photo plus starter editior, Và thú vị hơn cả là “phát triển một số thuật toán xử lý ảnh sử dụng mạng mạng nơ ron tế bào (CNN: cellular Neural Network)” trong đó có thuật toán lọc nhiễu làm trơn ảnh là bộ lọc nhiễu đốm thời gian thực dùng công nghệ mạng nơron tế bào, đây là công nghệ có tiềm năng ứng dụng phong phú, và điều quan trọng là có thể thực hiện nhiều mô hình tính toán xử lý thời gian thực phức tạp dùng CNNtrên phần cứng hoàn toàn. Đây là công nghệ rất đƣợc quan tâm hiện nay, hứa hẹn cho các lĩnh vƣc nghiên cứu toán học, vật lý, kỹ thuật điện tử về cơ bản và ứng dụng. 21
- Chương 2 : KỸ THUẬT LÀM TRƠN ẢNH Do có nhiều loại nhiễu can thiệp vào quá trình xử lý ảnh nên cần có nhiều bộ lọc thích hợp. Với nhiễu cộng và nhiễu nhân ta dùng các bộ lọc thông thấp, lọc trung bình và lọc đồng hình, với nhiễu xung ta dùng lọc trung vị, giả trung vị và lọc ngoài. 2.1.Làm trơn nhiễu bằng lọc tuyến tính (Linear Filter) 2.1.1. Lọc trung bình không gian (Mean Filter, Average Filter) Lọc trung bình là bộ lọc sử dụng cửa sổ lọc của lớp tuyến tính(linear class) để lọc nhiễu và làm trơn ảnh. Ý tƣởng cơ bản của bộ lọc này là thay thế giá trị tại mỗi điểm ảnh bằng trung bình các giá trị của các điểm lân cận nhằm loại bỏ những điểm ảnh biến đổi lớn so với điểm lân cận(nhiễu), và những điểm ảnh nằm trên biên cũng có sự biến đổi lớn so với lân cận. Chúng ta cùng xem một số ví dụ về cửa sổ lọc trong kĩ thuật lọc trung bình. Hình 2.1 : Cửa sổ lọc(mặt nạ) có kích thƣớc 5 trong 1D Hình 2.2: Cửa sổ lọc(mặt nạ) có kích thƣớc 3x3 trong 2D 22
- Hình 2.3 : Cửa sổ lọc (hay mặt nạ) kích thƣớc 3x3x3 trong 3D Hình 2.4 : Tính giá trị trung bình Lọc trung bình đƣợc biểu diễn bằng công thức toán học nhƣ sau: g(x, y) = a(k,l) f (x k, y l) (k,l) W Nếu trong kỹ thuật trên ta dùng các trọng số(của cửa sổ lọc) nhƣ nhau, phƣơng trình trên sẽ trở thành : 1 g(x,y) = f (x k, y l) N (k,l) W Với : f(x,y) : ảnh đầu vào 23
- g(x,y): ảnh đầu ra a(k,l): cửa sổ lọc(mặt nạ) 1 a(k,l) = và Nwlà số điểm ảnh của cửa sổ lọc W. N w Lọc trung bình có giá trịđiểm ảnh chính là tích nhân chập ảnh đầu vào với cửa sổ lọc H, cửa sổ H trong trƣờng hợp này có dạng : 1 1 1 1 H 1 1 1 9 1 1 1 Hình 2.5: Cách thức nhân chập điểm ảnh với cửa sổ 24
- Sơ lược một cách ngắn gọn các bước của giải thuật: 1. Quét cửa sổ lọc lần lƣợt lên các thành phần của ảnh đầu vào; điền các giá trị đƣợc quét vào cửa sổ lọc. 2. Xử lý bằng cách thao tác trên các thành phần của cửa sổ lọc. 3. Tính giá trị trung bình các thành phần trong cửa sổ lọc. 4. Gán giá trị trung bình này cho ảnh đầu ra. Ta thấy xuất hiện trƣờng hợp đặc biệt: Trong trƣờng hợp mảng một chiều thì cửa sổ lọc là một mảng có độ dài là 5(thƣờng chọn là 5- với 1 phần tử chính và 4 phần tử hai bên). Khi cửa sổ quét phần tử đầu tiên hoặc cuối cùng thì phần bên trái hay phần bên phải của phần tử sẽ không tồn tại. Hình 2.6 : Trƣờng hợp đặc biệt trong 1D Trong trƣờng hợp mảng hai chiều, khi tâm của cửa sổ lọc di chuyển tới gần biên của ảnh thì một hoặc một số dòng/cột của cửa sổ lọc sẽ nằm ra ngoài ảnh. Hình 2.7: Trƣờng hợp đặc biệt trong 2D Để giải quyết chúng ta có thể chọn một trong những cách giải quyết sau: 25
- - Cửa sổ lọc(mặt nạ) đƣợc cắt ngắn tại biên (biên tự do). - Mở rộng thêm dòng cột tại biên (hiệu chỉnh biên). - Biên đƣợc “bao bọc xung quanh” (chu kỳ biên). Hình 2.8: Ví dụ lọc trung bình Ưu điểm : Là bộ lọc tuyến tính đơn giản trong tính toán. Ảnh đạt độ trơn mịn. Khuyết điểm: Không hoàn toàn loại bỏ các tác dụng của nhiễu, các điểm ảnh đơn lẻ(nhiễu) sẽ ảnh hƣởng đến giá trị trung bình của các pixel lân cận. Độ sắc nét của ảnh kém. Độ tƣơng phản thấp. 2.1.2. Lọc thông thấp (Low pass Filter) Về nguyên lý của bộ lọc thông thấp cũng giống của lọc trung bình, nhƣng trong kỹ thuật này ngƣời ta dùng các cửa sổ lọc nhƣ sau: 26
- 0 1 0 1 H 1 2 1 8 0 1 0 1 b 1 1 2 Hb 2 b b b (b 2) 1 b 1 Ta thấy khi b = 1, Hb chính là cửa sổ lọc dùng trong kỹ thuật lọc trung bình. Vậy lọc trung bình chính là trƣờng hợp đặc biệt của lọc thông thấp. Để hiểu rõ hơn bản chất khử nhiễu cộng của bộ lọc này, ta viết phƣơng trình thu nhận ảnh dƣới dạng: Trong đó là nhiễu cộng có phƣơng sai . Nhƣ vậy theo cách tính trung bình ta có: Nhƣ vậy nhiễu cộng trong ảnh đã giảm đi Nw lần. 2.1.3. Lọc đồng hình (Homomorphie Filter) Kỹ thuật lọc này hiệu quả với ảnh có nhiễu nhân. Thực tế, ảnh quan sát đƣợc gồm ảnh gốc nhân với một hệ số nhiễu. Gọi X (m,n) là ảnh quan sát đƣợc, X(m,n) là ảnh gốc, và (m,n)là nhiễu. Nhƣ vậy: = * Lọc đồng hình thực hiện lấy logarit của ảnh quan sát. Do vậy ta có kết quả nhƣ sau: 27
- Log(X (m,n)) Log(X (m,n)) Log( (m,n)) Nhiễu nhân có trong ảnh sẽ bị giảm, sau quá trình lọc tuyến tính, ta chuyển về ảnh cũ bằng phép biến đổi hàm e mũ. 2.1.4. Gaussian Blur Gaussian blurring là cách làm mờ một ảnh bằng hàm Gaussian. Phƣơng pháp này đƣợc ứng dụng rộng rãi và hiệu quả trong các phần mềm xử lý đồ họa. Nó cũng là công cụ phổ biến để thực hiện quá trình tiền xử lý hình ảnh dùng để làm dữ liệu đầu vào tốt cho các phân tích cao cấp hơn trong Computer Vision, hoặc cho các giải thuật đƣợc thực hiện trong một tỉ lệ khác của hình đã đƣợc cho. Nhƣ vậy, ta có thể nói Gaussian blurr là một loại bộ lọc làm mờ ảnh, sử dụng lý thuyết hàm Gaussian(cũng đƣợc biết đến nhƣ là dạng phân tán chuẩn (Normal Distribution) trong thống kê) để tính toán việc chuyển đổi (Transformation) mỗi điểm ảnh của hình, giúp làm giảm nhiễu và mức độ chi tiết (không mong muốn) của hình ảnh. Đây là phƣơng trình hàm Gaussian (Gaussion Distribution) trong không gian một chiều. trong đó σ phƣơng sai chuẩn của phân tán Gaussian Hình 2.9 : Gaussian distribution with mean 0 and σ = 1 28
- Và trong không gian hai chiều : Hai chiều Hình 2.10 : Gaussian distribution with mean (0,0) and σ=1 Với x, y là tọa độ theo hai trục đứng và ngang. Trong không gian hai chiều, công thức này sản sinh ra những đƣờng viền là những đƣờng tròn đồng tâm, tuân theo logic phân tán Gausian từ điểm trung tâm. Giá trị từ hệ thống phân tán này sẽ đƣợc sử dụng để xây dựng một ma trận tích chập dùng tính toán phép tích chập với ảnh gốc. Hình 2.11: Discrete approximation to Gaussian function with σ =1.0 Giá trị mới sau khi tính tích nhân chập với cửa sổ (kernel) đại diện cho hàm Gaussian có thể coi là trung bình lƣợng giá của các điểm ảnh xung quanh nó. Ta thấy 29
- rằng giá trị lƣợng của phần tử trung tâm kernel tƣơng ứng với điểm ảnh đang xét là lớn nhất, giá trị này sẽ nhỏ hơn đối với các phần tử tƣơng ứng với các điểm ảnh kế cận một cách đối xứng và tỉ lệ thuận với khoảng cách của phần tử này với trung tâm. Tính chất này giúp giữ lại đƣờng viền và đƣờng biên cũng nhƣ làm mờ một cách đồng bộ hơn so với các phƣơng pháp khác. Trong lý thuyết, hàm Gaussian tại mỗi điểm trên hình là khác 0. Điều này có nghĩa là Gaussian kernel nên có kích thƣớc bằng với hình ảnh và giá trị tại mỗi phần luôn khác 0. Tuy nhiên trong thực hành, do việc tính toán dựa trên xấp xỉ rời rạc (Discrete Appoximation) cho nên giá trị của các phần tử trên bề mặt Gaussian ở khoảng cách lớn hơn 3σ so với trung tâm gần nhƣ không đáng kể (tiệm cận 0). Do vậy các Gaussian distribution ngoài bán kính này sẽ bị bỏ qua, đó cũng là lí do mà thông thƣờng Gaussian kernel có kích thƣớc giới hạn 3, 5, 7 (Cái này tùy thuộc vào giá trị phƣơng sai chuẩn mà bạn chọn). Khoảng cách giữa hai điểm gần nhau trong Gausssian kernel là σ. Do đặc tính cấu trúc nhƣ những hình tròn đối xứng, với hình hai chiều, Gaussian blur có thể đƣợc áp dụng nhƣ là hai phép tính toán một chiều độc lập (Độc lập tuyến tính- Linear Separable). Có nghĩa là hiệu quả thu đƣợc từ tính toán trên ma trận hai chiều có thể tƣơng đƣơng với cách ứng dụng tính toán một loạt các Gaussian một chiều theo hƣớng ngang và đứng. Điều này rất hữu ích trong việc giảm chi phí tính toán và thể hiện khá rõ trong hai công thức tƣơng ứng sau: O(ωkernelhkernelωimagehimage) và O(ωkernelωimagehimage)+O(hkernelωimagehimage) Một vấn đề nữa cần quan tâm của Gaussian blur là nếu chúng ta sử dụng lần lƣợt nhiều Gaussian cho một ảnh thì kết quả cũng tƣơng đƣơng với khi bạn dùng một Gaussian lớn hơn có bán kính bằng căn bậc hai tổng bình phƣơng các bán kính của các Gaussian đã dùng, ví dụ: . Cũng vì mối quan hệ này mà thời gian tính toán sẽ không đƣợc tiết kiệm khi bạn chia nhỏ các Gaussian. Do đó khuyến cáo nên sử dụng Gaussian đơn trong tính toán nếu có thể. Ngoài ra Gaussian blur cũng đƣợc sử dụng để giảm kích thƣớc hình ảnh. Khi tiến hành xử lý giảm tỉ lệ lấy mẫu tín hiệu cho ảnh (Downsampling), ngƣời ta thƣờng áp dụng bộ lọc low pass filter trƣớc khi tái lấy mẫu. Điều này là để chắc chắn những thông tin không mong muốn, tần số cao sẽ không xuất hiện trong hình đã đƣợc Downspamling. 30
- 2.2. Làm trơn bằng lọc phi tuyến 2.2.1.Lọc trung vị (Median Filter) Lọc trung vị là phép lọc phi tuyến đƣợc sử dụng phổ biến, do khả năng lọc khử nhiễu ngẫu nhiên tốt, và ít bị nhòe hơn so với phép lọc trung bình. Ý tƣởng : Sắp xếp các giá trị điểm ảnh trong cửa sổ tăng hoặc giảm dần so với trung vị. Kích thƣớc cửa sổ thƣờng đƣợc chọn sao cho số điểm ảnh trong cửa sổ là lẻ. Thay thế các giá trị pixel bằng giá trị giữa của danh sách. Hình 2.12 : Cách thức hoạt động của lọc trung vị Giả sử A= {a1, a2, a3, ,ak} là các giá trị pixel trong cửa sổ lân cận với a1≤a2≤ ≤ak. Thì Median(A) = A={0, 1, 2, 4, 6, 6, 10, 12, 15}→Median(A)= 6 Sơ lược một cách ngắn gọn các bước của giải thuật: 1. Quét cửa sổ lọc lần lƣợt lên các thành phần của ảnh đầu vào; điền các giá trị đƣợc quét vào cửa sổ lọc. 2. Xử lý bằng cách thao tác trên các thành phần của cửa sổ lọc. 3. Sắp xếp theo thứ tự các thành phần trong cửa sổ lọc. 31
- 4. Lƣu lại thành phần trung vị, gán cho ảnh đầu ra. Tính chất của lọc trung vị: Lọc trung vị là loại lọc phi tuyến. Điều này dễ nhận thấy qua phƣơng trình sau: Trung vị(x(m)+y(n)) ≠ trung vị(x(m)) + trung vị (y(n)) Đạt hiệu quả khá tốt trong việc loại bỏ các điểm ảnh hay các hàng mà vẫn bảo toàn độ phân giải. Hiệu quả giảm khi số điểm trong cửa sổ lớn hay bằng một nửa số điểm trong cửa sổ. Điều này dễ giải thích vì trung vị là (Nw+1)/2 giá trị lớn nhất nếu Nw lẻ. Lọc trung vị cho trƣờng hợp hai chiều coi nhƣ lọc trung vị tách đƣợc theo từng chiều. Nhận xét về lọc trung vị : Lọc trung vị cho kết quả thực sự tốt khi lọc ảnh với nhiễu xuất hiện làm cho điểm ảnh có cƣờng độ thay đổi mạnh nằm ngoài các giá trị điểm ảnh khác. Trong lọc trung vị, mỗi điểm ảnh đơn không có tính chất đặc trƣng thì sẽ không ảnh hƣởng đến mức giữa giá trị tín hiệu. Giá trị giữa chính xác sẽ là giá trị của một trong các điểm ảnh lân cận, lọc trung vị sẽ không tạo ra điểm ảnh mới có giá trị không chân thật khi bộ lọc tăng mức độ lọc. Vì lí do này mà lọc trung vị thì tốt hơn trong việc đảm bảo mức sắc nét của hình ảnh. Bộ lọc trung vị cho phép phần lớn các chi tiết ảnh có tần số không gian cao đi qua trong khi đó nó sẽ loại trừ có hiệu quả nhiễu trên ảnh (kết quả của việc này là bộ lọc trung vị cho kết quả không tốt khi lọc ảnh với nhiễu Gauss). Một trong những vấn đề đối với bộ lọc trung vị là chi phí thiết kế đắt tiền và tính toán phức tạp. Để thực thi lọc thì phƣơng pháp trung vị cần phải sắp xếp các giá trị ảnh lân cận thành trật tự số học và nhƣ vậy tốc độ xử lý chậm. 2.2.2. Lọc ngoài (Outlier Filter) Giả thiết có ngƣỡng nào đó cho các mức nhiễu(có thể dựa vào lƣợc đồ xám). Tiến hành so sánh giá trị của một điểm ảnh với trung bình số học 8 lân cận của nó. Nếu sai lệch lớn hơn ngƣỡng, điểm ảnh này đƣợc coi là nhiễu. Trong trƣờng hợp đó 32
- thay thế giá trị của điểm ảnh bằng giá trị 8 lân cận vừa tính đƣợc. Bộ lọc ngoài có thể biểu diễn bằng công thức nhƣ sau: Với a(w) là trung bình cộng các điểm trong lân cận w, là ngƣỡng ngoài. Các cửa sổ tính toán thƣờng là 3×3. Tuy nhiên có thể mở rộng ra 5×5 hoặc 7×7 để đảm bảo tính tƣơng quan của ảnh. Quan trọng là xác định ngƣỡng để loại nhiễu mà không làm mất thông tin của ảnh. 2.2.3. Loại bỏ đốm nhiễu Crimmins (Crimmins Speckle Removal) Hình 2.13 : Ảnh minh họa Crimmins Speckle Removal Loại đốm nhiễu Crimmins giảm nhiễu đốm trong ảnh bằng cách sử dụng thuật toán bóc vỏ bổ sung Crimmins (Crimmins complementary hulling algorithm). Thuật toán này đƣợc thiết kế đặc biệt để làm giảm cƣờng độ nhiễu muối tiêu (salt and pepper noise_ thuộc nhiễu nhân) trong ảnh. Không chỉ loại bỏ nhiễu, mà còn làm mờ một số lƣợng đáng kể các chi tiết có tần số cao trong ảnh. Cách thức hoạt động của loại đốm Crimmins? Nó đƣa ảnh qua bộ lọc loại bỏ đốm, đây là bộ lọc sử dụng kĩ thuật bóc vỏ bổ sung (tăng những điểm ảnh tối hơn so với nhứng điểm ảnh lân cận xung quanh, sau đó giảm những điểm ảnh sáng hơn so với những điểm ảnh lân cận xung quanh ). Thuật toán sử dụng kỹ thuật giảm nhiễu phi tuyến, nó so sánh cƣờng độ của mỗi điểm ảnh với 8 điểm ảnh lân cận gần nhất, và dựa trên các giá trị tƣơng đối mà nó tăng thêm hay giảm đi giá trị của điểm ảnh để nó có thể trở thành điểm ảnh đại diện thay cho các điểm lân cận xung quanh. Cách thức thay đổi (và phát hiện) điểm ồn (nhiễu) đƣợc sử dụng trong Crimmins phức tạp hơn cách thức đƣợc dùng trong bộ lọc phi tuyến trung vị. Nó bao gồm một loạt các hoạt động theo cặp, trong đó giá trị của điểm “giữa” trong cửa sổ đƣợc so sánh, lần lƣợt với mỗi 33
- tập hợp các lân cận (S-N, E-W, NW-SE, NE-SW) trong việc tìm kiếm ra những điểm gai (intensity spikes). Hình 2.14 : Crimmins Speckle removal algorithm Đối với mỗi lần lặp và cho mỗi cặp các điểm ảnh lân cận, toàn bộ hình ảnh đƣợc gửi đến bộ lọc hạt tiêu (pepper filter) và bộ lọc muối (salt filter) nhƣ trên. Trong ví dụ này, bộ lọc hạt tiêu đƣợc gọi đầu tiên để xác đinh xem điểm ảnh trung tâm và các lân cận phía bắc của nó, chênh lệch về đọ tối 2 mức cƣờng độ hay không, nếu sự so sánh này là đúng thì điểm ảnh tối hơn sẽ đƣợc làm sáng hơn 2 lần, nếu không thì sẽ không có sự thay đổi nào. Khi những thay đổi đã đƣợc lƣu lại thì toàn bộ ảnh sẽ đƣợc đƣa đến bộ lọc hạt tiêu một lần nữa và tất nhiên cũng với những so sánh nhƣ trên, nhƣng khác là ở đây so sánh điểm ảnh trung tâm với những điểm ảnh lân cận phía nam của nó. Trình tự này đƣợc lặp lại bởi bộ lọc muối. 34
- Có lƣu ý rằng, qua một số lần lặp lại, tác dụng của việc làm mịn theo cách này lan truyền cƣờng độ của điểm gai ảnh hƣởng đến các điểm ảnh lân cận. Nói cách khác, thuật toán làm mịn bằng cách giảm cƣờng độ của một điểm ảnh quá chênh lệch so với những điểm ảnh lân cận, cũng nhƣ tăng cƣờng độ các điểm lân cận quanh điểm gai đó. Điều quan trọng là nhận thấy điểm gai_điểm ảnh với giá trị cƣờng độ chênh lệch hai cấp so với các điểm ảnh bao quanh nó. Điều này có nghĩa là sau hai lần lặp của thuật toán, những điểm lân cận của điểm gai có thể trở thành những điểm gai nằm trong khu vực rộng lớn hơn. 2.2.4. Bộ lọc giữ biên (Kuwahara Filter) Biên đóng vai trò quan trọng trong cảm nhận ảnh của chúng ta và trong tích ảnh. Bằng cách nào đó ta làm trơn ảnh mà không mất đi độ sắc nét của biên, nếu có thể thì không làm thay đổi vị trí của biên. Bộ lọc đạt đƣợc mục đích này gọi là bộ lọc giữ biên. Bộ lọc này sử dụng một cửa sổ : Kích thƣớc J=K=4L+1, với L là số nguyên Chia cửa sổ thành 4 vùng (nhƣ mô tả sau) Trong mỗi vùng, ta tính trung bình độ sáng : Và bình phƣơng độ lệch chuẩn : là số điểm ảnh trong vùng R 35
- Giá trị đầu ra của điểm ảnh trung tâm trong cửa sổ là giá trị trung bình của vùng có bình phƣơng độ lệch chuẩn nhỏ nhất. 36
- Chương 3 : CHƢƠNG TRÌNH THỬ NGHIỆM 3.1.Bài toán Do tính chất công việc cũng nhƣ thẩm mỹ của con ngƣời luôn luôn thay đổi để phù hợp với thực tiễn mà những đòi hỏi, yêu cầu đặt ra cho xử lý ảnh ngày càng cao, đa dạng. Theo xu hƣớng đó, xử lý ảnh phát triển không ngừng hƣớng tới quy trình xử lý ảnh hoàn thiện. Và làm trơn ảnh là một trong những khâu quan trọng của quy trình xử lý ảnh. Việc đạt đến một công cụ toàn năng, có thể nâng cao chất lƣợng ảnh trên mọi tỉ lệ nhiễu, kiểu nhiễu cũng nhƣ mọi cấu trúc ảnh vẫn là một mục tiêu xa vời. Cụ thể hơn, một phƣơng pháp nếu làm tốt trên ảnh có tỉ lệ nhiễu thấp sẽ không đạt hiệu quả trên ảnh có tỉ lệ nhiễu cao và ngƣợc lại, hoặc nếu phƣơng pháp đƣợc thiết kế cho kiểu nhiễu xung này thì không nên áp dụng cho kiểu nhiễu xung khác, vì nó chẳng đạt hiệu quả cao. Ngoài ra, loại trừ tối đa nhiễu xung nhƣng vẫn đảm bảo duy trì thông tin chi tiết trên ảnh cũng là một trở ngại đáng kể. Chính vì vậy, trong lĩnh vực này vẫn còn rất nhiều cơ hội và thách thức. Với bài toán làm trơn ảnh, em cài đặt chƣơng trình thử nghiệm với hai kỹ thuật chính là lọc trung bình (minh họa cho làm trơn ảnh bằng lọc tuyến tính) và lọc trung vị (minh họa cho làm trơn nhiễu bằng lọc phi tuyến tính). Đầu vào : Một ảnh có định dạng JPG (hoặc PNG, BMP, GIF, JPEG) (bị ảnh hƣởng của nhiễu hoặc không). Đầu ra : Ảnh đã làm trơn (lọc trung bình) Ảnh đã đƣợc lọc nhiễu (lọc trung vị) 3.2.Phân tích và thiết kế Hoạt động của chƣơng trình : Bước 1: Đƣa một ảnh có định dạng JPG (hoặc PNG, BMP, GIF, JPEG) (bị ảnh hƣởng của nhiễu hoặc không). Bước 2: Chƣơng trình quét cửa sổ lọc lần lƣợt lên các thành phần của ảnh đầu vào; điền các giá trị đƣợc quét vào cửa sổ lọc. Bước 3: Xử lý bằng cách thao tác trên các thành phần của cửa sổ lọc. Bước 4: Sắp xếp theo thứ tự các thành phần trong cửa sổ lọc (lọc trung vị). 37
- Tính giá trị trung bình các thành phần trong cửa sổ lọc (lọc trung bình) Bước 5: Lƣu lại thành phần trung vị, gán cho ảnh đầu ra (lọc trung vị) Lƣu lại giá trị trung bình, gán cho ảnh đầu ra (lọc trung bình) Bước 6: Hiển thị ảnh kết quả. 3.3. Chƣơng trình làm trơn ảnh v.01 Chƣơng trình đƣợc xây dƣng bằng bộ công cụ Visual studio 2010 sử dụng ngôn ngữ lập trình C#. Chƣơng trìnhthử nghiệm cài đặt hai kỹ thuật khá phổ biến là lọc trung bình và lọc trung vị. Một số modul chính của chƣơng trình: 1. Chọn ảnh đầu vào 2. Xử lý ảnh bằng kỹ thuật lọc trung bình 3. Xử lý ảnh bằng kỹ thuật lọc trung vị 4. Hiển thị ảnh kết quả 5. Lƣu ảnh Một số giao diện chính của chƣơng trình: Hình 3.1: Giao diện chính của chƣơng trình 38
- Hình 3.2: Giao diện modul chọn ảnh đầu vào Một số kết quả thu đƣợc: Hình 3.3: Kết quả của lọc trung vị với cửa sổ 3×3 (ảnh nhiễu muối tiêu) 39
- Hình 3.4: Ảnh kết quả của lọc trung bình với cửa sổ 3×3 (ảnh nhiễu muối tiêu) Hình 3.5: Ảnh kết quả của lọc trung vị với cửa sổ 3×3 40
- Hình 3.6: Ảnh kết quả của lọc trung bình với cửa sổ 3×3 (ảnh nhiễu cộng) Hình 3.7: Ảnh kết quả của lọc trung vị với cửa sổ 5×5 41
- Hình 3.8: Ảnh kết quả của lọc trung bình với cửa sổ 5×5 Hình 3.9: Giao diện modul lƣu ảnh (ảnh sau khi xử lý) 42
- PHẦN KẾT LUẬN Trong quá trình nghiên cứu và thực hiện đồ án dƣới sự định hƣớng của thầy hƣớng dẫn, đồ án đã tìm hiểu đƣợc một cách tổng quan về xử lý ảnh và bài toán làm trơn ảnh, và một số kỹ thuật làm trơn ảnh. Dựa vào những tài liệu tìm đƣợc em đã tiến hành cài đặt chƣơng trình thử nghiệm, xây dựng thuật toán xử lý lọc trung bình và lọc trung vị. Chƣơng trình thử nghiệm cho kết quả khả quan, ảnh sau khi xử lý đã đƣợc làm trơn hơn so với ảnh gốc, tuy nhiên kết quả vẫn còn thiếu sót và em cảm thấy khi ứng dụng vào thực tế sẽ không đạt hiệu quả nhƣ mong muốn. Mặc dù đã hoàn thành đƣợc mục tiêu chính của đồ án nhƣng do điều kiện về thời gian có hạn mà lĩnh vực cần tìm hiểu cũng tƣơng đối rộng nên những gì tìm hiểu đƣợc trong đồ án sẽ khó tránh khỏi những thiếu sót. Chƣơng trình thử nghiệm cũng chƣa thực sự hoàn thiện nhƣng đó cũng là một kết quả khả quan. Trong thời gian tới nếu có điều kiện em sẽ tìm hiểu thêm và có thể sẽ xây dựng một chƣơng trình thử nghiệm về các thuật toán làm trơn ảnh hoàn chỉnh hơn. 43
- TÀI LIỆU THAM KHẢO Tài liệu Tiếng Việt [1]. Đỗ Năng Toàn, Phạm Việt Bình (2007), Giáo trình xử lý ảnh, Nhà xuất bản Đại học Thái Nguyên. [2]. Lƣơng Mạnh Bá, Nguyễn Thanh Thủy (2007), Nhập môn xử lý ảnh số, Nhà xuất bản KHKT. [3]. Nguyễn Quang Hoan (2006), Tài liệu đào tạo từ xaXử lý ảnh. Tài liệu Tiếng Anh [4].Narenda, Patrenahali M. A Separable Median Filter for Image Noise SmoothingPattern Analysis and Machine Intelligence, IEEE Transactions on. Pages 20- 29 [5] Yao Wang (2006). Image filtering : Noise removal, Sharpening, Deblurring, Polytechnic University, Brooklyn, NY11201. Website [6]. [7]. [8]. 44