Đồ án Tìm hiểu một số kỹ thuật khảm ảnh
Bạn đang xem 20 trang mẫu của tài liệu "Đồ án Tìm hiểu một số kỹ thuật khảm ảnh", để tải tài liệu gốc về máy bạn click vào nút DOWNLOAD ở trên
Tài liệu đính kèm:
- do_an_tim_hieu_mot_so_ky_thuat_kham_anh.pdf
Nội dung text: Đồ án Tìm hiểu một số kỹ thuật khảm ảnh
- 1 Bé gi¸o dôc vµ ®µo t¹o Tr•êng ®¹i häc d©n lËp h¶i phßng o0o T×m hiÓu mét sè kü thuËt kh¶m ¶nh ®å ¸n tèt nghiÖp ®¹i häc hÖ chÝnh quy Ngµnh: C«ng nghÖ Th«ng tin H¶i Phßng - 2011
- 2 MỤC LỤC MỤC LỤC 1 DANH MỤC HÌNH VẼ 4 DANH MỤC CHỮ VIẾT TẮT 6 MỞ ĐẦU 7 CHƢƠNG 1: KHÁI QUÁT VỀ XỬ LÝ ẢNH VÀ KHẢM ẢNH 8 1.1 Khái quát về xử lý ảnh 8 1.1.1 Xử lý ảnh là gì? 8 1.1.2 Các vấn đề cơ bản trong xử lý ảnh 10 1.1.2.1 Một số khái niệm 10 1.1.2.2 Ứng dụng của xử lý ảnh 13 1.2 Khảm ảnh 15 1.2.1 Khái niệm khảm ảnh 15 1.2.2 Các kỹ thuật chính đƣợc dùng trong khảm ảnh 25 1.2.3 Ứng dụng của khảm ảnh 25 1.2.3.1 Bản đồ số 25 1.2.3.2 Truyền thông quảng cáo 26 CHƢƠNG 2: KỸ THUẬT KHẢM ẢNH 29 2.1 Kỹ thuật đan đa phân giải (Multiresolution spline) 29 2.1.1 Hàm trọng số tƣơng đƣơng 34 2.1.2 Hình chóp Laplace 36 2.1.3 Các điều kiện đƣờng biên 37 2.1.4 Kỹ thuật đan đa phân giải 37 2.1.4.1 Đan chồng các ảnh 37 2.1.4.2 Đan các ảnh với các miền tùy ý 39 2.1.4.3 Đan các ảnh không chồng lên nhau 40 2.2 TRÍCH CHỌN ĐẶC TRƢNG TRONG KHẢM ẢNH 42
- 3 2.2.1 Kĩ thuật trích chọn đặc trƣng 42 2.2.1.1 Đặc trƣng màu sắc 43 2.2.1.2 Đặc trƣng kết cấu 44 2.2.1.3 Đặc trƣng hình dạng 45 2.2.1.4 Đặc trƣng cục bộ bất biến 45 2.2.2 Ứng dụng kĩ thuật trích chọn đặc trƣng trong khảm ảnh 51 CHƢƠNG 3: CHƢƠNG TRÌNH THỬ NGHIỆM 52 3.1 Bài toán 52 3.2 Phân tích, thiết kế 52 3.3 Chƣơng trình khảm ảnh 53 KẾT LUẬN 58 TÀI LIỆU THAM KHẢO 59 PHỤ LỤC 60
- 4 DANH MỤC HÌNH VẼ Hình 1.1: Quá trình xử lý ảnh 8 Hình 1.2: Các bƣớc cơ bản trong một hệ thống xử lý ảnh 8 Hình 1.3: Quan hệ giữa các điểm ảnh 11 Hình 1.4: Lƣợc đồ xám của ảnh 12 Hình 1.5: Bức ảnh bị dƣ tối có lƣợc đồ xám tập trung nhiều bên trái 13 Hình 1.6: Hình ảnh sau khi đƣợc chỉnh sửa lƣợc đồ xám đã đƣợc trải đều 13 Hình 1.7: Bản đồ Việt Nam nhận đƣợc từ vệ tinh 14 Hình 1.8: Ảnh hồng ngoại 15 Hình 1.9: Ảnh con chim đƣợc khảm từ rất nhiều ảnh nhỏ 16 Hình 1.10: Ảnh Panorama đƣợc ghép từ 4 hình ảnh chụp liên tiếp 17 Hình 1.11: Ảnh polar panorama 18 Hình 1.12: Ảnh khảm toàn cảnh 19 Hình 1.13 Ảnh mẫu sau khi đƣợc xử lý 20 Hình 1.14: Mẫu ảnh khảm 21 Hình 1.15: Ảnh khảm đƣợc tạo ra băng phƣơng pháp trên 22 Hình 1.16: Ảnh gốc 23 Hình 1.17: Làm nổi các màu sắc chủ đạo 23 Hình 1.18: Khảm các thành phần chủ đạo 24 Hình 1.19: Ảnh hoàn thiện 24 Hình 1.20: Ảnh chụp từ google maps 26 Hình 1.21: Ảnh quảng cáo của hãng IKEA 27 Hình 1.22: Ảnh bìa tạp chí y học Georgetown 28 Hình 2.1: Hai hình ảnh đƣợc nối ghép sao cho đƣờng nối càng mịn càng tốt 29 Hình 2.2: Các hàm trung bình trọng số và chiều rộng T của miền chuyển tiếp 30 Hình 2.3: Một số thử nghiệm kĩ thuật đan ghép với hình ảnh các ngôi sao 31 Hình 2.4: Mô tả phƣơng pháp lọc 1 chiều. 33 Hình 2.5: Hàm trọng số tƣơng đƣơng 35 Hình 2.6: Ảnh ghép từ hai ảnh vệ tinh của San Francisco. 38 Hình 2.7: Đan hình ảnh con mắt vào trong lòng bàn tay. 40 Hình 2.8: Ứng dụng của việc đan các ảnh không chồng nhau 41 Hình 2.9: Biểu đồ mô phỏng việc tính toán các DoG ảnh từ các ảnh kề mờ 47 Hình 2.10: Mỗi điểm ảnh đƣợc so sánh với 26 láng giềng của nó. 48 Hình 2.11: Quá trình lựa chọn các điểm hấp dẫn 48
- 5 Hình 2.12: Biểu diễn các vector đặc trƣng 49 Hình 3.1: Giao diện chƣơng trình khi khởi động 53 Hình 3.2: Giao diện chƣơng trình sau khi chọn ảnh nguồn dùng để khảm 54 Hình 3.3: Chọn thƣ mục chứa tập ảnh mẫu. 55 Hình 3.4: Ảnh khảm sử dụng ảnh mẫu kích thƣớc 20x20 56 Hình 3.5: Ảnh khảm sử dụng ảnh mẫu kích thƣớc 50x50 56 Hình 3.6: Hình ảnh phong cảnh đƣợc khảm từ tập ảnh mẫu 50x50 57 Hình 3.7: Hình ảnh phong cảnh đƣợc khảm từ tập ảnh mẫu 20x20 57
- 6 DANH MỤC CHỮ VIẾT TẮT AD Analog to Digital Ppi Pixel per inch Dpi Dot per inch DSLR Digital Single-lens reflex camera S.M.A.R.T Simultaneous Multi-compare Adaptive Rendering Technology SIFT Scale Invariant Feature Transform DoG Difference-of-Gaussian DA Discriminant Analysis MDA Mutiple Discriminant Analysis BDA biased Discriminant Analysis SMMS Symmetric Maximized Minimal Distance in Subspace JPG Joint Photographic Experts
- 7 MỞ ĐẦU Trong thời đại hiện nay, công nghệ thông tin có sự phát triển mạnh mẽ về mọi mặt. Cũng chính nhờ sự phát triển này đã góp phần rất lớn trong việc thúc đẩy sự phát triển của các ngành khác nhƣ: giáo dục, y tế, quốc phòng an ninh, giải trí, Những năm gần đây, phần cứng máy tính đã dần trở nên mạnh mẽ cả về năng lực xử lý lẫn dung lƣợng lƣu trữ vì thế mà các lĩnh vực phần mềm cũng đƣợc phát triển theo đặc biệt là lĩnh vực xử lý ảnh. Ngày nay, hầu hết các loại máy ảnh thông thƣờng dù độ phân giải có cao nhƣng cũng chỉ ghi lại đƣợc một phần của những đối tƣợng lớn ví dụ nhƣ sân vận động, công viên, thành phố hay thậm chí là mặt trăng hoặc một hành tinh nào đó. Hoặc tạo ra các hình ảnh độc đáo từ rất nhiều các ảnh nhỏ, điều này thì máy ảnh khó có thể thực hiện đƣợc. Chính vì vậy mà chúng ta cần đến kĩ thuật khảm ảnh. Khảm ảnh có thể xét trên hai phƣơng diện đó là khảm ảnh toản cảnh và khảm ảnh nhiều lớp. Mục đích của khảm ảnh chính là việc tạo ra những bức ảnh có tầm nhìn rộng hơn hoặc những bức hình nghệ thuật độc đáo. Trên cơ sở đó em đã lựa chọn đề tài: “Tìm hiểu một số kỹ thuật khảm ảnh” với mục đích chính là tìm hiểu một số kỹ thuật khảm ảnh đồng thời cài đặt một chƣơng trình thử nghiệm. Về lý thuyết: - Tìm hiểu khái quát về xử lý ảnh và một số kỹ thuật khảm ảnh. - Tìm hiểu một số kỹ thuật khảm ảnh trong xử lý ảnh. Về thực tiễn: - Cài đặt thử nghiệm một trong những kỹ thuật tìm hiểu đƣợc. Cấu trúc chính của đồ án bao gốm 3 chƣơng: Chƣơng 1: Khái quát về xử lý ảnh và khảm ảnh Trình bày khái quát về xử lý ảnh và khảm ảnh. Chƣơng 2: Kỹ thuật khảm ảnh Trình bày một số kỹ thuật khảm ảnh phổ biến. Chƣơng 3: Chƣơng trình thử nghiệm Chƣơng trình ứng dụng và một số kết quả thu đƣợc.
- 8 CHƢƠNG 1: KHÁI QUÁT VỀ XỬ LÝ ẢNH VÀ KHẢM ẢNH 1.1 Khái quát về xử lý ảnh 1.1.1 Xử lý ảnh là gì? Con ngƣời thu nhận thông tin qua các giác quan, trong đó thị giác đóng vai trò quan trọng nhất. Những năm trở lại đây với sự phát triển của phần cứng máy tính, xử lý ảnh và đồ hoạ đó phát triển một cách mạnh mẽ và có nhiều ứng dụng trong cuộc sống. Xử lý ảnh và đồ hoạ đóng một vai trò quan trọng trong tƣơng tác ngƣời máy. Quá trình xử lý ảnh đƣợc xem nhƣ là quá trình thao tác ảnh đầu vào nhằm cho ra kết quả mong muốn. Kết quả đầu ra của một quá trình xử lý ảnh có thể là một ảnh ―tốt hơn‖ hoặc một kết luận[1]. Ảnh ―Tốt hơn‖ Ảnh XỬ LÝ ẢNH Kết luận Hình 1.1: Quá trình xử lý ảnh Ảnh có thể xem là tập hợp các điểm ảnh và mỗi điểm ảnh đƣợc xem nhƣ là đặc trƣng cƣờng độ sáng hay một dấu hiệu nào đó tại một vị trí nào đó của đối tƣợng trong không gian và nó có thể xem nhƣ một hàm n biến P(c1, c2, , cn). Do đó, ảnh trong xử lý ảnh có thể xem nhƣ ảnh n chiều. Sơ đồ tổng quát của một hệ thống xử lý ảnh: Hệ quyết định Hệ quyết định Thu nhận ảnh Trích chọn Đối sánh rút (Scanner, Tiền xử lý Hậu xử lý đặc điểm ra kết luận Camera,Sensor) Lƣu trữ Hình 1.2: Các bƣớc cơ bản trong một hệ thống xử lý ảnh
- 9 Thu nhận ảnh (Image acquisition) Các thiết bị thu nhận ảnh có hai loại chính ứng với hai loại ảnh thông dụng là Raster và Vector. Các thiết bị thu nhận ảnh Raster là camera còn các thiết bị thu nhận ảnh Vector là sensor hoặc bộ số hoá (digitalizer) hoặc đƣợc chuyển đổi từ ảnh Raster. Các thiết bị thu ảnh thông thƣờng gồm camera cộng với bộ chuyển đổi tƣơng tự số AD (Analog to Digital) hoặc scanner chuyên dụng. Các thiết bị thu nhận ảnh này có thể cho ảnh đen trắng hoặc ảnh màu. Đầu ra của scanner là ảnh ma trận số mà ta quen gọi là bản đồ ảnh (ảnh Bitmap). Bộ số hoá (digitalizer) sẽ tạo ảnh vector có hƣớng. Nhìn chung, các hệ thống thu nhận ảnh thực hiện hai quá trình: • Cảm biến: biến đổi năng lƣợng quang học (ánh sáng) thành năng lƣợng điện. • Tổng hợp năng lƣợng điện thành ảnh. Tiền xử lý (Image processing) Tiền xử lý là bƣớc tăng cƣờng ảnh để nâng cao chất lƣợng ảnh. Do những nguyên nhân khác nhau: có thể do chất lƣợng thiết bị thu nhận ảnh, do nguồn sáng hay do nhiễu, ảnh có thể bị suy biến. Do vậy cần phải tăng cƣờng và khôi phục lại ảnh để làm nổi bật một số đặc tính chính của ảnh, hay làm cho ảnh gần giống nhất với trạng thái gốc - trạng thái trƣớc khi ảnh bị biến dạng. Trích chọn đặc điểm (Feature extraction) Vì lƣợng thông tin chứa trong ảnh là rất lớn, trong khi đó đa số ứng dụng chỉ cần một số thông tin đặc trƣng nào đó, cần có bƣớc trích chọn đặc điểm để giảm lƣợng thông tin khổng lồ ấy. Các đặc trƣng của ảnh thƣờng gồm: mật độ xám, phân bố xác suất, phân bố không gian, biên ảnh. Hậu xử lý Nếu lƣu trữ ảnh trực tiếp từ các ảnh thô (brut image) theo kiểu bản đồ ảnh đòi hỏi dung lƣợng bộ nhớ lớn, tốn kém mà nhiều khi không hiệu quả theo quan điểm ứng dụng. Thƣờng ngƣời ta không biểu diễn toàn bộ ảnh thô mà tập trung đặc tả các đặc trƣng của ảnh nhƣ biên ảnh (boundary) hay vùng ảnh (region) . Một số phƣơng pháp biểu diễn thƣờng dùng: • Biểu diễn mã loạt dài (Run-Length Code). • Biểu diễn mã xích (Chaine -Code).
- 10 • Biểu diễn mã tứ phân (Quad-Tree Code). Ảnh là một đối tƣợng khá phức tạp về đƣờng nét, độ sáng tối, dung lƣợng điểm ảnh, môi trƣờng để thu ảnh phong phú kéo theo nhiễu. Trong nhiều khâu xử lý và phân tích ảnh ngoài việc đơn giản hóa các phƣơng pháp toán học đảm bảo tiện lợi cho xử lý, ngƣời ta mong muốn bắt chƣớc quy trình tiếp nhận và xử lý ảnh theo cách của con ngƣời. Trong các bƣớc xử lý đó, nhiều khâu hiện nay đã xử lý theo các phƣơng pháp trí tuệ con ngƣời. Vì vậy, ở đây các cơ sở tri thức- hệ quyết định đƣợc phát huy. Đối sánh rút ra kết luận So sánh ảnh sau bƣớc hậu xử lý với mẫu chuẩn hoặc ảnh đã đƣợc lƣu trữ từ trƣớc, phục vụ cho các mục đích nhận dạng và nội suy ảnh. 1.1.2 Các vấn đề cơ bản trong xử lý ảnh 1.1.2.1 Một số khái niệm a. Ảnh Trong thực thế ảnh liên lục về không gian và độ sáng. Để xử lý đƣợc bằng máy tính thì ảnh cần đƣợc số hóa. Số hóa ảnh là sự biến đổi gần đúng một ảnh liên tục thành tập điểm phù hợp với ảnh thật về vị trí và độ sáng. Khoảng cách giữa các điểm ảnh đó đƣợc thiết lập sao cho mắt ngƣời không phân biệt đƣợc ranh giới giữa chúng. Mỗi điểm nhƣ vậy gọi là điểm ảnh (pixel). Từ đó ta có định nghĩa : Điểm ảnh đƣợc xem nhƣ là dấu hiệu hay cƣờng độ sáng tại 1 toạ độ trong không gian của đối tƣợng và ảnh đƣợc xem nhƣ là một tập hợp các điểm ảnh. Khi đƣợc số hoá, nó thƣờng đƣợc biểu diễn bởi bảng hai chiều I(n,p): n dòng và p cột. Ta nói ảnh gồm n x p điểm ảnh. Ngƣời ta thƣờng kí hiệu I(x,y) để chỉ một điểm ảnh. Thƣờng giá trị của n chọn bằng p và bằng 256. Một điểm ảnh có thể lƣu trữ trên 1, 4, 8 hay 24 bit . Về mặt toán học có thể xem ảnh là một hàm hai biến f(x,y) với x, y là các biến tọa độ. Giá trị số ở điểm (x,y) tƣơng ứng với giá trị xám hoặc độ sáng của ảnh (x là các cột, y là các hàng). Giá trị của hàm ảnh f(x,y) đƣợc hạn chế trong phạm vi của các số nguyên dƣơng: 0 ≤ f(x,y) ≤ fmax . Thông thƣờng đối với ảnh xám, giá trị fmax là 255 (28=256) bởi vì mỗi phần tử ảnh đƣợc mã hóa bởi một byte. Khi quan tâm đến ảnh
- 11 màu, ta có thể mô tả màu qua ba hàm số: R(x,y) của màu đỏ, G(x,y) của màu xanh lục và B(x,y) của màu xanh lam. Ảnh có thể đƣợc biểu diễn theo mô hình Vector hoặc mô hình Raster: • Mô hình Raster Đây là mô hình biểu diễn ảnh thông dụng nhất hiện nay. Ảnh đƣợc biểu diễn dƣới dạng ma trận các điểm ảnh. Tùy theo nhu cầu thực tế mà mỗi điểm ảnh có thể đƣợc biểu diễn bởi một hay nhiều bit. Mô hình Raster rất thuận lợi cho hiển thị và in ấn. Khi xử lý các ảnh Raster, chúng ta quan tâm đến mối quan hệ trong vùng lân cận của các điểm ảnh. Các điểm ảnh có thể xếp hàng trên một lƣới (Raster) hình vuông, lƣới hình lục giác hoặc theo một cách hoàn toàn ngẫu nhiên với nhau: Hình 1.3: Quan hệ giữa các điểm ảnh • Mô hình Vector Biểu diễn ảnh ngoài mục đích tiết kiệm không gian lƣu trữ, dễ dàng cho hiển thị và in ấn, còn phải đảm bảo dễ dàng trong lựa chọn, sao chép, di chuyển, tìm kiếm Theo những yêu cầu này, kỹ thuật biểu diễn Vector tỏ ra ƣu việt hơn. Trong mô hình Vector ngƣời ta sử dụng hƣớng giữa các Vector của điểm ảnh lân cận để mã hoá và tái tạo hình ảnh ban đầu. Ảnh Vector đƣợc thu nhận trực tiếp từ các thiết bị số hóa nhƣ Digital hoặc đƣợc chuyển đổi từ ảnh Raster thông qua các chƣơng trình số hóa. Công nghệ phần cứng cung cấp những thiết bị xử lý với tốc độ nhanh và chất lƣợng cao cho cả đầu vào và ra, nhƣng lại chỉ hỗ trợ cho ảnh Raster. Do vậy, những nghiên cứu về biểu diễn Vector đều tập trung chuyển đổi từ ảnh Raster . b. Độ phân giải Độ phân giải là số lƣợng điểm ảnh (pixel) dùng để tập hợp thành hình ảnh. Số lƣợng điểm ảnh càng nhiều và càng nhỏ thì độ nét và chi tiết ảnh sẽ càng cao.
- 12 Có 3 cách để biểu thị độ phân giải ảnh: • Biểu thị bằng số lƣợng điểm ảnh theo chiều dọc và chiều ngang của ảnh (ví dụ: 1024 x 768) • Biểu thị bằng tổng số điểm ảnh trên 1 tấm ảnh (960.000 pixel) • Biểu thị bằng số lƣợng điểm ảnh có trên 1 inch (ppi) hoặc số chấm(dot) có trên 1 inch (dpi) c. Mức xám của ảnh Mức xám là kết quả sự mã hoá tƣơng ứng một cƣờng độ sáng của mỗi điểm ảnh với một giá trị số - kết quả của quá trình lƣợng hoá. Cách mã hoá kinh điển thƣờng dùng 16, 32 hay 64 mức. Mã hoá 256 mức là phổ dụng nhất do lý do kỹ thuật. Vì 28 = 256 (0, 1, , 255), nên với 256 mức, mỗi pixel sẽ đƣợc mã hoá bởi 8 bit. Lược đồ xám hay còn gọi là biểu đồ tần suất đƣợc biểu diễn trong hệ tọa độ vuông góc Oxy. Trong hệ tọa độ này, trục hoành biểu diễn cho số mức xám từ 0 đến N, N là số mức xám (thƣờng xét với mức 256). Trục tung biểu diễn số điểm ảnh cho một mức xám (số điểm ảnh có cùng mức xám). Cũng có thể biểu diễn là: trục tung là tỉ lệ số điểm ảnh có cùng mức xám trên tổng số điểm ảnh. Hình 1.4: Lƣợc đồ xám của ảnh Lƣợc đồ xám cung cấp rất nhiều thông tin về phân bố mức xám của ảnh. Theo thuật ngữ của xử lý ảnh gọi là tính động của ảnh. Tính động của ảnh cho phép phân tích trong khoảng nào đó phân bố phần lớn các mức xám của ảnh: ảnh rất sáng hay ảnh rất đậm. Nếu ảnh sáng, lƣợc đồ xám nằm bên phải (mức xám cao), còn ảnh đậm lƣợc đồ xám nằm bên trái (mức xám thấp). Hình 1.5 và 1.6 là một ví dụ :
- 13 Hình 1.5: Bức ảnh bị dƣ tối có lƣợc đồ xám tập trung nhiều bên trái Hình 1.6: Hình ảnh sau khi đƣợc chỉnh sửa lƣợc đồ xám đã đƣợc trải đều 1.1.2.2 Ứng dụng của xử lý ảnh Ban đầu, các kỹ thuật xử lý ảnh đây chủ yếu đƣợc sử dụng để nâng cao chất lƣợng hình ảnh, chính xác hơn là tạo cảm giác về sự gia tăng chất lƣợng ảnh quang học trong mắt ngƣời quan sát. Thời gian gần đây, phạm vi ứng dụng xử lý ảnh mở rộng không ngừng, có thể nói hiện không có lĩnh vực khoa học nào không sử dụng các thành tựu của công nghệ xử lý ảnh số . Trong y học các thuật toán xử lý ảnh cho phép biến đổi hình ảnh đƣợc tạo ra từ nguồn bức xạ X-ray hay nguồn bức xạ siêu âm thành hình ảnh quang học trên bề mặt film x-quang hoặc trực tiếp trên bề mặt màn hình hiển thị. Hình ảnh các cơ quan chức năng của con ngƣời sau đó có thể đƣợc xử lý tiếp để nâng cao độ tƣơng phản, lọc, tách các thành phần cần thiết (chụp cắt lớp) hoặc tạo ra hình ảnh trong không gian ba chiều (siêu âm 3 chiều).
- 14 Trong lĩnh vực địa chất, hình ảnh nhận đƣợc từ vệ tinh có thể đƣợc phân tích để xác định cấu trúc bề mặt trái đất. Kỹ thuật làm nổi đƣờng biên (image enhancement) và khôi phục hình ảnh (image restoration) cho phép nâng cao chất lƣợng ảnh vệ tinh và tạo ra các bản đồ địa hình 3-D với độ chính xác cao. Hình 1.7: Bản đồ Việt Nam nhận đƣợc từ vệ tinh Trong ngành khí tƣợng học, ảnh nhận đƣợc từ hệ thống vệ tinh theo dõi thời tiết cũng đƣợc xử lý, nâng cao chất lƣợng và ghép hình để tạo ra ảnh bề mặt trái đất trên một vùng rộng lớn, qua đó có thể thực hiện việc dự báo thời tiết một cách chính xác hơn. Dựa trên các kết quả phân tích ảnh vệ tinh tại các khu vực đông dân cƣ còn có thể dự đoán quá trình tăng trƣởng dân số, tốc độ ô nhiễm môi trƣờng cũng nhƣ các yếu tố ảnh hƣởng tới môi trƣờng sinh thái. Ảnh chụp từ vệ tinh có thể thu đƣợc thông qua các thiết bị ghi hình cảm nhận đƣợc tia sáng quang học (450-520 nm), hoặc tia hồng ngoại (760-900 nm). Thiết bị thu hình nhạy cảm với vật thể bức xạ các tia trong miền hồng ngoại sẽ cho ra những bức ảnh trong đó vật thể có nhiệt độ thấp sẽ đƣợc phân biệt rõ ràng so với vật thể có nhiệt độ cao hơn. Nhƣ vậy việc lựa chọn các thiết bị ghi hình khác nhau sẽ tạo ra ảnh có đặc tính khác nhau, tùy thuộc vào mục đích sử dụng trong các lĩnh vực khoa học cụ thể.
- 15 Hình 1.8: Ảnh hồng ngoại Xử lý ảnh còn đƣợc sử dụng nhiều trong các hệ thống quản lý chất lƣợng và số lƣợng hàng hóa trong các dây truyền tự động, ví dụ nhƣ hệ thống phân tích ảnh để phát hiện bọt khí bên vật thể đúc bằng nhựa, phát hiện các linh kiện không đạt tiêu chuẩn (bị biến dạng) trong quá trình sản xuất hoặc hệ thống đếm sản phẩm thông qua hình ảnh nhận đƣợc từ camera quan sát. Xử lý ảnh còn đƣợc sử dụng rộng rãi trong lĩnh vực hình sự và các hệ thống bảo mật hoặc kiểm soát truy cập: quá trình xử lý ảnh với mục đích nhận dạng vân tay hay khuôn mặt cho phép phát hiện nhanh các đối tƣơng nghi vấn cũng nhƣ nâng cao hiệu quả hệ thống bảo mật cá nhân cũng nhƣ kiểm soát ra vào. Ngoài ra, có thể kể đến các ứng dụng quan trọng khác của kỹ thuật xử lý ảnh tĩnh cũng nhƣ ảnh động trong đời sống nhƣ tự động nhận dạng, nhận dạng mục tiêu quân sự, máy nhìn công nghiệp trong các hệ thống điều khiển tự động, nén ảnh tĩnh, ảnh động để lƣu và truyền trong mạng viễn thông v.v. 1.2 Khảm ảnh 1.2.1 Khái niệm khảm ảnh Khảm (mosaic) là nghệ thuật ghép mảnh từ các vật liệu nhƣ đá, gạch, thủy tinh, có từ thời La Mã cổ đại và đƣợc ứng dụng nhiều trong kiến trúc công cộng nhƣ nhà thờ, đền đài, cung điện Ngày nay, mosaic đƣợc ứng dụng rộng rãi trong nhiều lĩnh vực, đặc dụng nhất là trang trí nội ngoại thất kiến trúc. Tuy nhiên không chỉ vậy mà khảm còn đƣợc ứng dụng vào trong xử lý ảnh để tạo ra các bức hình mang phong cách mới mẻ nhằm phục vụ cho rất nhiều mục đích khác nhau từ trƣng bày trong các phòng triển lãm đến việc tạo các hình ảnh quảng cáo độc đáo.
- 16 Khảm ảnh là việc tạo ra hình ảnh mới bằng cách ghép các ảnh nhỏ vào 1 ảnh lớn sao cho khi nhìn tổng thể vào ảnh lớn thì ta vẫn có thể nhìn thấy nội dung của bức ảnh lớn trƣớc đó. Khảm ảnh có thể đƣợc chia thành hai loại chính đó là: khảm ảnh toàn cảnh và khảm ảnh nhiều lớp. Hình 1.9: Ảnh con chim đƣợc khảm từ rất nhiều ảnh nhỏ • Khảm toàn cảnh Ảnh toàn cảnh (Panorama), Panorama bắt nguồn từ tiếng Hy Lạp, có nghĩa là góc nhìn rộng trong một không gian nhất định. Kỹ thuật Panorama đƣợc sử dụng trong rất nhiều môn nghệ thuật nhƣ sơn, vẽ, dựng hình 3D và đặc biệt là trong nhiếp ảnh cho bạn một bức ảnh toàn cảnh tuyệt vời. Một bức ảnh thông thƣờng chỉ đƣợc chụp với một góc 90 độ, nên rất khó để bạn có thể thu lại hết toàn cảnh không gian rộng lớn mà bạn mong muốn. Với Panorama, một bức ảnh hiển thị cả 3600 là một chuyện có thể thực hiện dễ dàng. Ngày xƣa, để tạo ra một bức ảnh toàn cảnh Panorama, các nhà nhiếp ảnh chuyên nghiệp đã phải sử dụng những máy ảnh đắt tiền, và ngồi nhiều ngày liền trong phòng tối ráp những bức ảnh lại với nhau bằng kỹ thuật phơi sáng phức tạp. Nhƣng ngày nay, trong thời đại kỹ thuật số, công việc này trở nên nhẹ nhàng hơn rất nhiều. Bạn có thể sắm cho mình dòng máy ảnh chuyên nghiệp DSLR chuyên chụp ảnh Panorama nhƣng có một cách không cần đến loại máy ảnh chuyên dụng đó, chỉ cần loại máy ảnh kỹ thuật số thông thƣờng cũng đã hỗ trợ tình năng này tuy nhiên vẫn còn cách khác đó là sử dụng máy ảnh thông thƣờng chụp các bức hình liên tiếp sau
- 17 đó đƣa lên máy tính và sử dụng các phần mềm ghép hình là bạn đã có một tấm hình Panorama độc đáo. Ảnh Panorama đƣợc chia làm nhiều loại, nhƣng phổ biến nhất là hai kiểu chụp sau: Thứ nhất, chụp một cảnh ra thành nhiều file, sau đó dùng phần mềm ghép chúng lại với nhau. Với cách chụp này, bạn có thể chụp phong cảnh theo chiều ngang (chiều rộng lớn gấp nhiều lần chiều dài để lấy hết toàn bộ khung cảnh rộng lớn), hoặc chụp theo chiều dọc (còn đƣợc gọi là vertorama, chiều dài lớn gấp nhiều lần chiều rộng để lấy hết chiều cao những tòa nhà cao tầng). Hình 1.10: Ảnh Panorama đƣợc ghép từ 4 hình ảnh chụp liên tiếp
- 18 Thứ hai là Polar Panorama. Chụp 360 độ bằng cách dùng chân đỡ giáp vòng, chụp cả trên lẫn dƣới theo dạng hình cầu (biến không gian lớn thành một hành tinh nhỏ). Hình 1.11: Ảnh polar panorama Một số phần mềm hỗ trợ cho việc khảm, ghép ảnh toàn cảnh là : Photoshop, Panorama Factory, AutoStitch, Hugin, Panorama Maker, Pixtra OmniStitcher Hầu hết các phần mềm ghép ảnh toàn cảnh đều qua 3 công đoạn chính nhƣ sau: Bước 1: Sắp xếp các ảnh đầu vào theo thứ tự thích hợp Bước2: Phần mềm sẽ tính toán và ghép các ảnh đó với nhau. Các ảnh sẽ đƣợc xếp trùng một phần lên nhau và các phần ảnh chung sẽ đƣợc ghép lại một cách hợp lý. Trong khâu này còn một phần cũng khá quan trọng đó là nắn chỉnh các đƣờng biên trong ảnh. Bởi ảnh ban đầu chụp thƣờng không thể hoàn toàn trùng khít nhau do góc độ chụp, ánh sáng, hay do thiết bị chụp vì vậy cần phải nắn chỉnh lại các đƣờng biên sao cho chúng hợp lý nhất giữa các ảnh. Bước 3: Sau khi đã ghép xong thì vấn đề đặt ra là phải làm trơn các vùng chuyển tiếp giữa các ảnh để bức ảnh thể hiện đƣợc không gian liên tục, đồng nhất. Phần mềm sẽ sử dụng các kĩ thuật khác nhau để sao cho
- 19 bức ảnh đẹp nhất. Một số kỹ thuật thƣờng thấy đó là khớp biểu đồ tần suất, các kỹ thuật lọc Tuy nhiên việc khảm ảnh toàn cảnh còn thể hiện ở góc độ cao hơn là ghép toàn cảnh từ nhiều file khác nhau theo nhiều hƣớng của bức ảnh chứ không chỉ ghép theo chiều ngang hoặc chiều dọc. Hình 1.12: Ảnh khảm toàn cảnh • Khảm nhiều lớp Trong lĩnh vực hội họa, để tạo ra một bức tranh khảm thì họa sĩ cần phải hình dung, tƣởng tƣợng ra bức tranh toàn cảnh mà mình đang vẽ đồng thời vẽ các chi tiết nhỏ bên trong để cuối cùng cho ra một bức tranh khảm. Điều này đòi hỏi rất cao về mặt chuyên môn và năng khiếu thẩm mỹ đồng thời tiêu tốn rất nhiều thời gian và công sức. Trong xử lý ảnh cũng tạo ra đƣợc những bức tranh khảm nhƣ vậy nhƣng có điều nó làm hơi ngƣợc một chút. Từ bức tranh tổng thể ban đầu, bằng các kỹ thuật xử lý khác nhau thì các bức ảnh nhỏ đƣợc lồng ghép vào đó tạo nên bức ảnh mới. Tất nhiên là nếu nhìn một cách tổng thể thì nó vẫn chính là bức tranh lớn ban đầu có điều nó khác đi một chút bởi những chi tiết bên trong đã đƣợc thay thế bởi các hình ảnh đơn lẻ. Về quy trình tạo nên một hình ảnh khảm nhiều lớp này thì việc đầu tiên không thể thiếu đó chính là 2 thành phần chính: ảnh nguồn (ảnh dùng làm nền toàn cảnh) và
- 20 ảnh mẫu (các ảnh nhỏ đƣợc dùng để ghép vào ảnh mục tiêu các ảnh này đƣợc thu thập càng đa dạng càng tốt và đƣợc lƣu chung tại một thƣ mục). Có rất nhiều phƣơng pháp khác nhau để thực hiện khảm ảnh, sau đây là một số phƣơng pháp thƣờng đƣợc sử dụng: Thứ nhất theo nhƣ trang thì công đoạn tạo ra ảnh khảm gồm 5 bƣớc (Giải thuật này đƣợc dựa trên giải thuật của giáo sƣ Walldel): Bước 1: Xử lý các ảnh nhỏ: - Chuyển các ảnh nhỏ này thành ảnh đen trắng. Thực hiện bằng cách lấy trung bình các giá trị R, G, B rồi đặt đồng thời các giá trị R, G, B đó bằng giá trị trung bình. - Thu nhỏ các hình này lại nếu cần thiết. Chỉnh kích thƣớc cho các ảnh nhỏ đồng nhất nhau. Hình 1.13 Ảnh mẫu sau khi đƣợc xử lý Bước 2: Thay đổi kích thƣớc ảnh gốc - Để có tạo ra các lƣới trên ảnh gốc bằng với kích thƣớc các ảnh mẫu một các nhanh chóng và dễ dàng thì ảnh gốc sẽ đƣợc cắt để kích thƣớc của nó là một bội số của kích thƣớc của các ảnh mẫu nhỏ (đã đƣợc xử lý). Bước 3: Tạo mẫu khảm - Tạo một ảnh khảm là khái niệm gần gũi hơn với việc xây dựng một hình ảnh mới dựa trên đặc điểm của hình ảnh gốc, thay vì làm thay đổi hình ảnh cơ bản, hoặc nhúng các hình ảnh nhỏ vào nó, vv. - Để tạo một mẫu khảm thì thực hiện các bƣớc nhƣ sau: • Tạo mới một hình ảnh trống có kích thƣớc bằng với kích thƣớc ảnh gốc đã đƣợc cắt. • Phủ đầy lên ảnh trống này một cách tùy ý các ảnh mẫu nhỏ theo một lƣới đƣợc dựng sẵn (mắt lƣới này có kích thƣớc bằng các ảnh nhỏ)
- 21 Hình 1.14: Mẫu ảnh khảm Bước 4: Hòa trộn (blend) ảnh khảm mẫu với ảnh gốc - Tại bƣớc này, chƣơng trình sẽ dùng thuật toán để phân tích mỗi vùng trên các lƣới của ảnh khảm mẫu với ảnh gốc để tập hợp đặc tính của cả 2 vùng. Đó chính là giá trị R, G, B và phân tích giá trị suy biến. - Sử dụng các giá trị đó để chuyển giá trị R, G, B tại mỗi vùng trên ảnh khảm mẫu thành chỉ số màu sắc đƣợc lấy từ các vùng tƣơng tứng trên ảnh gốc.
- 22 Hình 1.15: Ảnh khảm đƣợc tạo ra băng phƣơng pháp trên Khác với giải thuật của giáo sƣ Walldel. Giải thuật cũng nhƣ thuật toán tạo ảnh khảm của Robert Silvers thì khác. Cũng sử dụng các ảnh nhỏ nhƣng số lƣợng ảnh nhỏ này rất lớn, cũng không cần chuyển các ảnh nhỏ này về đen trắng. Ông chia ảnh gốc theo các lƣới nhỏ có kích thƣớc bằng các ảnh nhỏ rồi so sánh các vùng đó với tất cả các ảnh nhỏ trong tập mẫu rồi sẽ lấy ảnh mẫu có thông số gần với vùng đó nhất để thay thế vào ảnh gốc. Ngoài ra trên trang cũng đề cập tới một phƣơng pháp khảm ảnh rất hay, nó cho ra những bức tranh khảm với chất lƣợng rất tốt. Ở đây không giống nhƣ các phần mềm khác là chia bức ảnh nguồn thành các lƣới với các ô hình vuông hoặc hình chữ nhật cố định mà họ đã chia ảnh nguồn thành các ―vùng mềm‖ (soft zones) mà họ còn gọi là vùng thích nghi (Adaptive Regions™). Điều này sẽ giúp cho một số vùng quan trọng trong bức ảnh nguồn của bạn đƣợc quan tâm đặc biệt nhƣ vậy nội dung chính của bức ảnh sẽ đƣợc bảo toàn nhất. Bằng việc sử dụng kĩ thuật kép để phân tích các hình ảnh đối với các khuôn dạng mà màu sắc họ đã cho thấy hiệu quả của việc sử dụng các vùng thích nghi để tối ƣu cho việc lựa chọn các vùng
- 23 xuất hiện trên bức ảnh. Họ xác định và tối ƣu các thành phần quan trọng trong bức ảnh nhƣ văn bản, khuôn mặt, logo, .v.v Và tất cả những ô đƣợc chia trên ảnh gốc đều rất nhỏ, điều này khiến cho bức ảnh càng giống với ảnh gốc. Hình 1.16: Ảnh gốc Hình 1.17: Làm nổi các màu sắc chủ đạo
- 24 Hình 1.18: Khảm các thành phần chủ đạo Hình 1.19: Ảnh hoàn thiện Ngày nay, có rất nhiều các phần mềm khảm ảnh đã và đang đƣợc xây dựng. Trong đó phải kể đến những cái tên nhƣ : Photoshop, Easy Mosaic, Mazaika, AndreaMosaic, Photomosaic Generator
- 25 1.2.2 Các kỹ thuật chính đƣợc dùng trong khảm ảnh • Đan đa phân giải (Multiresolution spline). • Khớp biểu đồ tần suất (Histogram matching). • Khớp cạnh (Edge matching). • Phân tích cấu trúc (Texture analysis). • Phân tích hình khối (Shape analysis). • Trích trọn đặc trƣng. • S.M.A.R.T.™[7] Ngoài các kỹ thuật chính trên thì các kĩ thuật lọc cũng đƣợc áp dụng để làm mịn đi các vùng chuyển tiếp giữa các ảnh ghép làm cho bức ảnh thành phẩm mịn hơn. 1.2.3 Ứng dụng của khảm ảnh Không chỉ dừng lại ở việc tạo ra các hình ảnh độc đáo mang phong cách mới lạ, khảm ảnh còn đƣợc ứng dụng rất rộng rãi trong nhiều lĩnh vực khác nhau. 1.2.3.1 Bản đồ số Chắc hẳn cái tên bản đồ số không còn xa lạ gì đối với những ngƣời dùng internet ngày nay. Hoặc kể đến cái tên nổi bật đó chính là google maps, vietbando. Họ cho phép ngƣời dùng xem bản đồ ở chế độ vệ tinh. Khi xem bản đồ này tất cả mọi ngƣời đều nhận thấy một điều rất rõ đó chính là bản đồ đƣợc ghép lại từ rất nhiều hình ảnh khác nhau, điều này đƣợc nhận thấy rất rõ qua màu sắc có phần khác biệt giữa từng vùng bản đồ, hay thậm chí là hình ảnh không khớp của các đám mây, con đƣờng Bản đồ số chính là một ví dụ điển hình của kỹ thuật khảm ảnh. Những hình ảnh này đƣợc chụp từ các ống kính có độ phân giải rất cao trên vệ tinh, ảnh đƣợc gửi về các trung tâm nghiên cứu quốc gia rồi từ đây, các hình ảnh đã đƣợc ghép lại với nhau tạo nên bản đồ số hoàn chỉnh.
- 26 Hình 1.20: Ảnh chụp từ google maps 1.2.3.2 Truyền thông quảng cáo Giờ đây, mọi ngƣời đã quá quen thuộc với các bức ảnh thông thƣờng, nên nó ít gây đƣợc sự chú ý. Chính vì thế mà một bức ảnh mang phong cách khảm mới lạ chắc chắn sẽ thu hút đƣợc sự chú ý của mọi ngƣời hơn. Điều này có tác dụng tích cực trong các lĩnh vực quảng cáo, giới thiệu sản phẩm. Ví dụ nhƣ ảnh quảng cáo ản phẩm của hãng Ikea – một hãng sản xuất đồ gia dụng, ảnh bìa tạp chí y học Georgetown
- 27 Hình 1.21: Ảnh quảng cáo của hãng IKEA
- 28 Hình 1.22: Ảnh bìa tạp chí y học Georgetown
- 29 CHƢƠNG 2: KỸ THUẬT KHẢM ẢNH 2.1 Kỹ thuật đan đa phân giải (Multiresolution spline) Kỹ thuật đan đa phân là kỹ thuật đƣợc nghiên cứu bởi PETER J. BURT và EDWARD H. ADELSON thuộc trung tâm nghiên cứu RCA David Sarnoff. Kỹ thuật này đƣợc dùng để kết hợp hai hoặc nhiều ảnh vào một ảnh khảm lớn hơn. Đầu tiên, các ảnh dùng để đan sẽ đƣợc phân tích thành tập band-pass[5] các thành phần hình ảnh đã đƣợc lọc. Sau đó, các ảnh thành phần sẽ đƣợc ghép lại thành ảnh khảm band-pass tƣơng ứng. Trong bƣớc này, các ảnh thành phần đƣợc nối với nhau bằng hàm trung bình trọng số bên trong miền chuyển tiếp đó là tỉ lệ kích thƣớc độ dài sóng đƣợc biểu diễn trong các band đó. Cuối cùng, các ảnh khảm band-pass này đƣợc tổng hợp lại thành ảnh khảm mong muốn. Bằng cách này hàm nối đƣợc làm khớp với tỉ lệ với các đƣờng bao bên trong những ảnh đó. Khi các đƣờng bao thô xuất hiện gần biên, chúng đƣợc pha trộn dần dần qua một khoảng cách tƣơng đối lớn mà không đƣợc làm mờ đi các chi tiết xung quanh đƣờng viền. Hình 2.1: Hai hình ảnh đƣợc nối ghép sao cho đƣờng nối càng mịn càng tốt Đối với các ảnh chụp từ kính viễn vọng, trong trƣờng hợp này thì kỹ thuật khảm ảnh đƣợc dùng để tạo ra cá hình ảnh có phạm vi rộng lớn hoặc là mức độ chi tiết hơn một ảnh đơn. Trong lĩnh vực quảng cáo hay đồ họa máy tính, công nghệ này có thể tổng hợp lên hình ảnh từ các thành phần khác nhau.
- 30 Một vấn đề chung cho tất cả các ứng dụng của khảm ảnh đó là khi các ảnh đƣợc ghép nối với nhau thì đƣờng biên giữa chúng phải đƣợc làm ẩn đi. Chỉ cần một khác biệt nhỏ trong mức xám của ảnh trên đƣờng biên rộng cũng rất dễ nhận thấy. Thật không may là điều này rất khó tránh khỏi, có thể do vị trí đặt máy hay trong khâu xử lý. Nhƣ vậy một kỹ thuật cần đòi hỏi đó sẽ thay đổi mức xám của hình ảnh trong vùng lân cận của đƣờng biên để đạt đƣợc sự chuyển tiếp mƣợt giữa các ảnh. Hai hình ảnh đƣợc dùng để ghép nối có thể xem nhƣ hai bề mặt, nơi mà cƣờng độ hình ảnh I(x, y) tƣơng ứng đƣợc chiếu lên không gian x, y. Vấn đề đặt ra, nhƣ trong hình minh họa 2.1, có thể đƣợc nói nhƣ sau: Làm thế nào để hai mặt đó có thể đƣợc làm biến dạng một cách nhẹ nhàng để có đƣợc một đƣờng nối trơn tru? Họ đã sử dụng thuật ngữ đan ghép ảnh - ―image spline‖ để chỉ kỹ thuật làm nên điều này. Một kĩ thuật đan ghép ảnh tốt sẽ cho ra những bức ảnh ghép có đƣờng biên mịn. Hình 2.2: Các hàm trung bình trọng số và chiều rộng T của miền chuyển tiếp Sự khác biệt của độ lớn trong mức xám của đƣờng biên ảnh khảm có thể đƣợc giảm xuống mức nào đó bởi lựa chọn đúng đắn của vị trí đƣờng biên khi đan các ảnh vào nhau. Đƣờng nối có thể đƣợc cải thiện bằng cách thêm vào đó một đƣờng nối tuyến tính để giá trị điểm ảnh hai bên cân bằng nhau. Một quá trình chuyển đổi vẫn mƣợt mà có thể thu đƣợc bằng cách sử dụng một kỹ thuật gần đây đã đƣợc đề xuất bởi Peleg [5]. Chức năng hiệu chỉnh ―mịn nhất có thể‖ đã đƣợc xây dựng, nó thêm vào mỗi ảnh của ảnh khảm để loại bỏ sự khác biệt của đƣờng biên. Tuy nhiên kĩ thuật này không thiết thực đối với các ảnh lớn, bởi chức năng hiệu chỉnh phải đƣợc tính toán bằng việc sử dụng một thuật toán lặp đi lặp lại. Họ quan tâm tới phƣơng pháp đan ghép trung bình trọng số. Để bắt đầu, ngƣời ta cho rằng những hình ảnh sẽ đƣợc nối chồng lên nhau để nó có thể tính toán giá trị mức xám của các điểm trong một khu vực
- 31 chuyển tiếp nhƣ trung bình trọng số trong mỗi ảnh. Giả sử trong hai bức ảnh, Fl(i) ở bên trái còn Fr(i) nằm bên phải hai bức ảnh này đƣợc nối chồng lên nhau tại điểm i (biểu diễn trên một chiều để đơn giản hóa các kí hiệu). Đặt Hl(i) là hàm trọng số bên trái và hàm này giảm đơn điệu từ trái sang phải và đặt Hr(i) = 1 – Hl(i). Sau đó hình ảnh đƣợc đan ghép F cho bởi: F(i) = Hl(i— ) Fl(i) + Hr(i— ) Fr(i) (2.1) Rõ ràng là với một sự lựa chọn H thích hợp, kĩ thuật trung bình trọng số sẽ cho kết quả là miền chuyển tiếp mịn. Tuy nhiên, chỉ riêng điều này chƣa đảm bảo đƣợc vùng biên sẽ đƣợc làm mờ. Cho T là độ rộng của miền chuyển tiếp với Hl chạy từ 1 đến 0. Nếu T là nhỏ so với các điểm đặc trƣng của ảnh thì biên có thể vẫn xuất hiện. Mặt khác, nếu T rộng so với các điểm đặc trƣng của ảnh thì trong miền chuyển tiếp các chi tiết của cả hai ảnh có thể xuất hiện chồng lên nhau, giống nhƣ trong một bức ảnh đƣợc phơi sáng hai lần. Hình 2.3: Một số thử nghiệm kĩ thuật đan ghép với hình ảnh các ngôi sao
- 32 Trong hình 2.3, các bức ảnh gốc hình 2.3a và hình 2.3b có cùng kích thƣớc và chỉ khác nhau một số dịch chuyển không đáng kể vị trí thẳng đứng và một sự thay đổi nhỏ về mức xám. Sự khác biệt đầu tiên có thể nảy sinh từ sự biến dạng quang học hoặc độ lệch thực tế của ảnh, sự khác biệt thứ hai có thể do sự khác biệt về điều kiện khí quyển hoặc về công nghệ nhiếp ảnh. Trong ví dụ này, ảnh khảm đƣợc tạo bằng cách nối nửa trái của hình 2.3a với nửa phải của hình 2.3b. Nếu việc này đƣợc thực hiện mà không có bất kì biện pháp nào để làm mịn vùng chuyển tiếp ảnh (T = 0) thì đƣờng biên sẽ xuất hiện rõ nét nhƣ trong hình 2.3c. Nếu thay vào đó, các ảnh đƣợc nối bằng phƣơng pháp trung bình trọng số trong một miền chuyển tiếp hẹp (T = 8) thì đƣờng biên đó vẫn xuất hiện nhƣng nó sẽ mờ đi nhƣ trong hình 2.3d. Khi các ảnh đƣợc đan với miền chuyển tiếp rộng (T = 64) thì không nhìn thấy cạnh nữa nhƣng trong miền chuyển tiếp các ngôi sao nhìn nhƣ đƣợc phơi sáng hai lần nhƣ hình 2.3e. Rõ ràng là kích thƣớc vùng chuyển tiếp liên quan đến kích thƣớc của các đặc trƣng trong hình ảnh, nó đóng vai trò rất quan trọng trong việc đan ghép ảnh. Để loại bỏ đƣờng biên hiện ra thì chiều rộng của vùng chuyển tiếp phải đƣợc so sánh ít nhất với kích thƣớc lớn nhất của các đặc trƣng trong ảnh. Mặt khác để tránh hiệu ứng phơi sáng hai lần, vùng chuyển tiếp không đƣợc lớn hơn nhiều so với đặc trƣng nhỏ nhất của hình ảnh. Không có sự lựa chọn nào của T thỏa mãn đủ cả hai yêu cầu trong những hình ngôi sao của hình 2.3 bởi sự khuếch tán nền và những ngôi sao nhỏ. Các hạn chế có thể đƣợc phát biểu chính xác hơn trong ảnh không gian tần số. Đặc biệt, một T phù hợp chỉ có thể đƣợc lựa chọn nếu những hình ảnh đƣợc đan chiếm một dải tần số không gian tƣơng đối hẹp. Với yêu cầu phức tạp, chúng ta có thể quy định rằng T sẽ đƣợc so sánh kích thƣớc với độ lớn của tần số thấp nhất nổi bật trong ảnh. Nếu T nhỏ hơn, thì sự đan ghép sẽ giới thiệu một khía cạnh đáng chú ý khác. Mặt khác để tránh hiệu ứng phơi sáng hai lần, T không đƣợc lớn hơn nhiều so với độ dài hai sóng của các thành phần có tần số cao nhất trong bức ảnh. Điều này đảm bảo rằng sẽ không có nhiều thành phần trong khu vực chuyển tiếp. Trong khi nó có khả năng là các giới han này có thể vƣợt quá một chút mà không có sự thay đổi nào đáng chú ý. Vậy độ rộng dải tần của hình ảnh đƣợc đan nên xấp xỉ một quãng 8[5]. Làm thế nào để đan các ảnh có dải tần vƣợt quá một quãng 8? Cách tiếp cận đƣợc đề xuất ở đây là đầu tiên các ảnh này có thể đƣợc tách ra thành một tập các ảnh thành phần band-pass. Sau đó, mỗi phần đan với một T thích hợp. Cuối cùng, các thành phần band-pass đã đan đƣợc nối lại với nhau thành ảnh khảm mong muốn. Chúng ta
- 33 gọi hƣớng tiếp cận này là đan đa phân giải [5]. Kĩ thuật này đã đƣợc sử dụng để tạo nên hình 2.3f. Trong việc phân tích ảnh thành nhiều dải tần số, điều quan trọng là dải tần trong ảnh gốc phải đƣợc phủ đều, mặc dù các dải tần bản thân chúng có thể chồng chéo lên nhau. Thực tế, tập các bộ lọc low-pass[5] - bộ lọc cho phép những ảnh có tần số bé hơn một tần số xác định đi qua đƣợc dùng để sinh một chuỗi các ảnh. Trong các ảnh này, giới hạn dải tần của chúng giảm dần qua từng ảnh với bƣớc nhảy là một quãng 8. Các ảnh band-pass có thể đƣợc tạo ra dễ dàng bằng cách trừ mỗi ảnh low-pass cho ảnh ngay trƣớc nó. Điều này không chỉ chắc chắn phủ hoàn toàn dải tần, mà còn có ý nghĩa là ảnh khảm cuối cùng có thể dễ dàng tạo ra bằng cách tổng hợp các ảnh band-pass thành phần. Chuỗi các ảnh lọc low-pass G0, G1, , GN có thể đƣợc tạo ra bằng cách cuộn liên tiếp một hàm trọng số nhỏ với ảnh. Với kĩ thuật này, mật độ ảnh mẫu sẽ giảm đi sau mỗi lần lặp, do đó độ rộng dải tần cũng giảm trong các bƣớc thống nhất một quãng 8. Sự giảm bớt mẫu cũng có nghĩa là chi phí tính toán sẽ giảm xuống mức tối thiểu. Hình 2.4: Mô tả phƣơng pháp lọc 1 chiều. Dấu chấm của mỗi dòng trong hình 2.4 biểu diễn các mẫu, các điểm ảnh của một trong các ảnh đã đƣợc lọc. Dòng thấp nhất G0 là ảnh gốc. Giá trị của mỗi node ở dòng tiếp theo (G1) đƣợc tính bằng trung bình trọng số của 1 mảng con kích thƣớc 5 x 5 của các node G0. Sau đó, các node của dòng G2 đƣợc tính từ G1 cũng với trọng số tƣơng tự. Tiến trình đƣợc lặp đi lặp lại để tính G2 từ G1, G3 từ G2 và cứ tiếp tục nhƣ vậy. Khoảng cách mẫu đƣợc nhân đôi sau mỗi lần lặp, do đó các mảng liên tiếp chỉ rộng bằng một nửa mảng trƣớc nó. Nếu chúng ta hình dung các mảng này đƣợc xếp
- 34 mảng nọ chồng lên mảng kia thì kết quả sẽ là một cấu trúc dữ liệu hình chóp. Nếu kích thƣớc ảnh gốc là (2N +1) x (2N +1) thì hình chóp sẽ có N+1 mức. Cả mật độ mẫu và độ phân giải đều giảm theo từng mức của hình chóp. Trong trƣờng hợp này, chúng ta sẽ gọi tiến trình sinh ra mỗi mức của hình chóp từ mức liền trƣớc nó là phép toán REDURE[5]. Đặt G0 là ảnh gốc. Sau đó cho 0<l<N: Gl = REDUCE [Gl-1] (2.2) Nghĩa là: Gl(i,j) = (2.3) Mẫu trọng số w(m, n) đƣợc sử dụng để sinh mỗi mức hình chóp từ mức liền trƣớc nó đƣợc gọi là nhân hàm sinh. Các trọng số này đƣợc chọn theo bốn điều kiện: Đầu tiên, để thuận tiện cho tính toán, nhân hàm sinh phải tách đƣợc: w(m, n) = (m) (n) (2.4) Thứ hai, mỗi hàm một chiều là đối xứng: (0) = a, (- 1) = (1) = b, và (- 2) = (2) = c (2.5) Thứ ba, thì đƣợc định mức: a + 2b + 2c = 1. (2.6) Cuối cùng, mỗi node của mức l phải đóng góp cùng một trọng số tổng vào các node của mức l +1, vì thế a + 2c = 2b. Bây giờ, kết hợp các ràng buộc, chúng ta nhận thấy rằng a có thể coi là biến tự do, b = 1/4 và c = 1/4 – a/2. 2.1.1 Hàm trọng số tƣơng đƣơng Rõ ràng là mỗi node mức l trong hình chóp tƣơng ứng với một trung bình trọng số của mảng con 5 x 5 các node của mức l - 1. Mỗi một lần lặp tƣơng ứng với một giá trị trung bình của mảng con của mức l - 2. Theo cách này, chúng ta có thể truy vết đƣợc các trọng số từ node đã cho của hình chóp ngƣợc trở lại ảnh G0 để nhận đƣợc ―hàm trọng số tƣơng đƣơng‖[5] Wl thoả mãn. Nếu đƣợc cuộn trực tiếp với ảnh gốc, nó sẽ cho các giá trị node giống mức l. Đó là thuận lợi để thảo luận về tính toán dựa trên hình chóp dƣới dạng các hàm trọng số tƣơng đƣơng, mặc dù tiến trình lặp REDUCE hiệu quả hơn nhiều và đƣợc sử dụng trong tất cả các tính toán.
- 35 Các hàm trọng số tƣơng đƣơng có nhiều tính chất quan trọng trong các toán tử lọc và đan ghép. Tính co giãn của các hàm này tăng gấp đôi sau mỗi mức của hình chóp trong khi khuôn dạng của chúng không thay đổi. Khuôn dạng hàm phụ thuộc vào giá trị của các tham biến a trong nhân hàm sinh. Ví dụ, nếu a = 0,5 thì tất cả các hàm sẽ có dạng tam giác (triangular in shape). Nếu a = 0,4 thì các hàm sẽ tƣơng tự với hàm mật độ xác suất Gauss. Việc cuộn với hàm Gauss sẽ cho hiệu ứng ảnh lọc low-pass. Cấu trúc hình chóp tƣơng đƣơng với cuộn ảnh với một tập các hàm giống nhƣ hàm Gauss để tạo ra tập các ảnh lọc tƣơng ứng. Chúng ta sẽ xét chuỗi các ảnh G0 , GN này nhƣ là hình chóp Gauss. Giả sử các mẫu trong G0 cách nhau một đơn vị khoảng cách. Sau đó, các mẫu tại mức l cách nhau khoảng 2l. Điều này có thể đƣợc thể hiện bằng độ rộng của hàm trọng l+2 l+2 số tƣơng đƣơng Wl là 2 – 4, phủ 2 – 3 mẫu ảnh hoặc khoảng cách mẫu giảm 4 lần. Với mọi i, j và l: (2.7) Kết quả này có đƣợc từ tính chất phân bố đều của nhân hàm sinh. Khuôn dạng Gauss và các đặc tính tổng hợp của các hàm Wl có ý nghĩa là chúng ta có thể xây dựng hàm trọng số H cần tìm để đan ảnh (Hình 2.2). Giả sử rằng Wl liên quan tới mỗi node trong nửa trái của Gl trong khi trọng số bằng 0 với các node bên phải (hình 2.5). Sau đó, tổng của các hàm này sẽ tạo thành một hàm điệu giảm từ 1 xuống 0 với miền chuyển tiếp độ rộng T gấp 3 lần khoảng cách mẫu mức l. Tính chất này sẽ đƣợc sử dụng trong kĩ thuật đan đa phân giải dựa trên hình chóp (pyramid-based multiresolution spline), mặc dù các hàm H và W không bao giờ tính đƣợc một cách cụ thể. Hình 2.5: Hàm trọng số tƣơng đƣơng
- 36 2.1.2 Hình chóp Laplace Hình chóp Gaussian là tập các ảnh lọc low-pass. Để tạo ra các ảnh band-pass cần thiết cho đan đa phân giải (multiresolution spline), chúng ta trừ mỗi mức của hình chóp cho mức thấp nhất trƣớc nó. Vì các mảng này khác biệt về mật độ mẫu, nên trƣớc khi trừ cần phải nội suy các mẫu trung gian. Phép nội suy có thể đạt đƣợc bằng cách đảo chiều tiến trình REDUCE. Chúng ta sẽ gọi phép toán tử này là EXPAND[5]. Đặt Gl,k là ảnh thu đƣợc bằng cách mở rộng Gl k lần: Gl,0=Gl (2.8) Và với k>0: Gl,k=EXPAND [Gl,k-1] (2.9) Với EXPAND, chúng ta đã thực hiện: Gl,k (i, j) = 4 (2.10) Ở đây, (2i+m)/2 và (2j+n)/2 là các số nguyên và Gl,1 cùng kích thƣớc với Gl-1 và Gl,1 cùng khích thƣớc với ảnh gốc. Bây giờ, chúng ta sẽ định nghĩa một chuỗi ảnh band-pass L0, L1, .,LN. với 0 < l < N Ll = Gl – EXPAND[Gl+1]= Gl - Gl+1,1 (2.11) Vì không có mảng mức cao hơn để trừ cho GN, nên chúng ta định nghĩa LN = GN. Khi giá trị của mỗi node trong hình chóp Gaussian thu đƣợc trực tiếp từ việc cuộn hàm trọng số Wl với ảnh. Mỗi node của Ll có thể thu đƣợc trực tiếp bằng cách cuộn Wl - Wl+1 với ảnh. Sự khác biệt của hàm Gaussian-like[5] giống nhƣ những ngƣời thƣờng sử dụng phƣơng pháp Laplace trong xử lý ảnh. Vì vậy chúng ta có thể tham khảo các dãy L0, L1, . . ., LN nhƣ là phƣơng pháp hình chóp laplace. Các bƣớc tạo ra hình chóp Laplace cũng có thể đƣợc đảo ngƣợc để khôi phục lại ảnh gốc G0 một cách chính xác. Mức trên cùng của chóp, LN, trƣớc tiên đƣợc mở rộng và cộng vào LN-1 để khôi phục GN-1. Mảng này sau đó đƣợc mở rộng và cộng vào LN-2 để đƣợc GN-2 và cứ tiếp tục nhƣ vậy. Ta có thể viết: G0 = (2.12)
- 37 Các biện pháp mở rộng và tổng hợp có thể đƣợc sử dụng để tạo ảnh khảm từ tập các thành phần band-pass của chính nó. 2.1.3 Các điều kiện đƣờng biên Cả hai phép toán REDUCE và EXPAND cần đặc biệt chú ý tới các nút biên. Ví dụ, khi một thủ tục REDUCE đƣợc thực thi, nhân hàm sinh cho mỗi node biên tại mức Gl=1 mở rộng thêm hai node so với Gl. Vì thế, trƣớc khi thực thi REDUCE hay EXPAND, Gl đƣợc tăng lên hai hàng node mỗi chiều. Các giá trị đƣợc gán tại các nút cho bởi phép phản xạ và đảo ngƣợc qua các node biên. Vì thế, nếu Gl(0,j) là node biên trái của Gl, chúng ta đặt: Gl(-1, j) = 2Gl(0, j) – Gl(1, j) (2.13) Và: Gl(-2, j) = 2Gl(0,j) – Gl(2, j) (2.14) 2.1.4 Kỹ thuật đan đa phân giải 2.1.4.1 Đan chồng các ảnh Thuật toán đan đa phân giải có thể đƣợc định nghĩa đơn giản hơn dƣới dạng các toán tử hình chóp cơ bản đã đƣợc giới thiệu ở trên. Thuật toán có thể thay đổi để đan các ảnh có một phần chung (gối lên nhau - overlap), không có phần chung (không gối lên nhau - nonoverlap) và đan các ảnh có hình dạng tuỳ ý. Để bắt đầu, giả sử chúng ta muốn đan nửa trái ảnh A với nửa phải ảnh B. Giả sử các ảnh này đều là hình vuông, mỗi cạnh 2N +1 pixel mỗi chiều và giả sử chúng hoàn toàn chồng lắp. Quá trình đan thực hiện sau 3 bƣớc: Bước 1: Dựng các hình chóp Laplace LA và LB tƣơng ứng cho ảnh A và ảnh B. Bước 2: Dựng một chóp Laplace LS bằng cách sao chép các cạnh từ bên trái của LA vào các node tƣơng ứng của LS và các node bên phải LB vào bên phải LS. Các node thuộc đƣờng chính giữa của LS đƣợc gán bằng giá trị trung bình của các node LA và LB tƣơng ứng. Đƣờng chính giữa tại mức l của chóp Laplace tại i=2N-1. Vì vậy, với mọi i, j, l: LSl(i,j) = (2.15)
- 38 Bước 3: Ảnh đan S đƣợc tạo bằng cách mở rộng và cộng các mức của LS. Kết quả của việc áp dụng thủ tục này cho ảnh ngôi sao trên đƣợc trình bày trong hình 2.3f. Hình 2.6: Ảnh ghép từ hai ảnh vệ tinh của San Francisco. Ví dụ thứ 2 đƣợc thể hiện trong hình 2.6. Ở đây, chúng ta muốn đan hai ảnh vệ tinh của San Francisco, hình 2.6a và hình 2.6b. Các ảnh này giống hệt nhau trừ độ nhiễu nền khuyếch tán do khác nhau do điều kiện khí quyển hoặc quá trình xử lý ảnh. Một lần nữa, chúng ta muốn tạo nên một bức ảnh ghép mà trong đó, nửa bên trái là của một ảnh và nửa bên phải là của ảnh khác. Nếu chỉ ghép mà không đan ảnh thì đƣờng biên sẽ lộ rõ nhƣ hình 2.6c. Tuy nhiên, nếu sử dụng kĩ thuật đan đa phân giải, cạnh hầu nhƣ bị xoá bỏ, điều này đƣợc thể hiện ở hình 2.6d.
- 39 2.1.4.2 Đan các ảnh với các miền tùy ý Các bƣớc ở trên có thể đƣợc tổng quát hoá lên để tạo ra một ảnh khảm từ các miền ảnh có hình dạng tuỳ ý. Một lần nữa, chúng ta giả thiết rằng miền đƣợc đan chứa trong ảnh A và B. Nhƣ trên, các node của các chóp Laplace LA và LB cho các ảnh thành phần sẽ đƣợc kết nối để tạo thành chóp Laplace LS của ảnh kết quả S. Chúng ta giới thiệu thêm một cấu trúc tháp để xác định các node nào của LS đƣợc lấy từ LA, node nào từ LB và node nào là trung bình của hai. Đặt R là ảnh nhị phân kích thƣớc bằng A và B, trong đó, tất cả các điểm ảnh trong miền của ảnh A đƣợc đan với B có giá trị là 1 và tất cả các điểm ngoài miền này là 0. Các bƣớc của kĩ thuật đan đa phân giải đƣợc chỉnh sửa nhƣ sau: Bước 1: - Dựng các chóp Laplace LA và LB tƣơng ứng cho ảnh A và B. - Dựng chóp Gaussian GR cho miền ảnh R Bước 2: - Tạo một chóp liên kết LS từ LA và LB sử dụng các node của GR nhƣ là các trọng số. Nghĩa là, với mỗi l, i, j: LSl(i, j) = GRl(i, j)LAl(i, j) + (1 - GRl(i, j))LBl(i, j) (2.16) Bước 3: - Thu đƣợc ảnh đan S bằng cách mở rộng và cộng các mức của LS. Hình chóp Gaussian phục vụ hai mục đích: nó là một phƣơng thức tiện lợi để xác định các node tại mỗi mức nằm trong vùng mặt nạ của ảnh R và nó ―làm mềm‖ các cạnh của mặt nạ trong suốt quá trình lọc. Các node rơi đúng vào biên mặt nạ sẽ nhận trọng số 50%.
- 40 Hình 2.7: Đan hình ảnh con mắt vào trong lòng bàn tay. Trong hình 2.7, hình 2.7a và hình 2.7b là 2 ảnh gốc: một con mắt và một bàn tay. Hình 2.7c là miền của bức ảnh đầu tiên đƣợc đan vào bức ảnh thứ hai. Hình 2.7d là kết quả cuối cùng của kĩ thuật đan: Con mắt đã đƣợc đan vào trong lòng bàn tay 2.1.4.3 Đan các ảnh không chồng lên nhau Kĩ thuật trung bình trọng số chỉ đƣợc áp dụng cho các bức ảnh chồng lên nhau. Tuy nhiên, một ảnh đan phù hợp có thể đƣợc tạo bởi các bức ảnh tiếp giáp với nhau nhƣng không chồng lên nhau nếu mỗi ảnh đƣợc ngoại suy qua biên của nó để tạo thành một miền chuyển tiếp chồng lên nhau. Vì độ rộng của miền chuyển tiếp có thể là một phần của độ rộng của bản thân bức ảnh, nên việc ngoại suy dƣờng nhƣ là một nhiệm vụ khó khăn. Tuy nhiên, trong kĩ thuật đan đa phân giải ngoại suy có thể thực hiện độc lập trong mỗi dải tần. Hơn nữa, khi thuật toán hình chóp đƣợc sử dụng, chỉ có hai ảnh mẫu cần đƣợc ngoại suy bên ngoài biên của mỗi mức. Trong thực tế nó chỉ là loại ngoại suy của đƣờng biên đã đƣợc xử lý trong khi xây dựng cả hình chóp Gaussian và Laplace. Không có các bƣớc tiếp theo cần đƣợc thực hiện trong đan ghép.
- 41 Hình 2.8: Ứng dụng của việc đan các ảnh không chồng nhau Chúng ta bắt đầu với một ảnh duy nhất mà chính nó là một ảnh khảm của khối 16x16 pixel (chỉ có mảng trung tâm 8x8 của khối đƣợc biểu diễn trong hình minh họa). Mỗi khối đƣợc xây dựng lại từ một sự biến đổi mã rất cao. Trong trƣờng hợp này, đại diện cho hình ảnh ở tỉ lệ chỉ 0.5bit/pixel. Khối chuyển đổi mã ở mức rất thấp của khối biên nổi bật tạo ra trong phép cộng để suy biến mạnh các hình ảnh khác. Nhiệm vụ của chúng ta là loại vỏ đƣờng biên bằng phƣơng pháp đan đa phân giải. Ảnh gốc có kích thƣớc 16x16 của khối. Trƣớc khi thử nghiệm đan, chúng ta sử dụng phép ngoại suy để thêm một hàng bên phải và bên dƣới của mỗi khối. Kết quả các khối 17x17 phù hợp với cấu trúc hình chóp và sự ghép chồng vào ảnh bởi 1 pixel mỗi chiều. Đây là bƣớc đầu tiên của đan ghép. Phƣơng pháp là xây dựng một hình chóp Laplace cho mỗi khối của 256 khối. Những hình chóp này đƣợc nối lại thành một hình chóp duy nhất với với các nút trong cạnh chồng lên nhau và đƣợc lấy trung bình của các mức. Đặt Llmn là mức lth của hình chóp laplace đã đƣợc xây dựng, với khối nth trong hàng thứ mth của khối. Sau đó, với i và j không trong khối đƣờng biên (ví dụ: i và j không bằng bội số của 24-l) và 0 < l <3 LSl(i, j) = Llmn( ) (2.17) Trong đó m là phần nguyên của i/24 – l, n là phần nguyên của j/24 – l, = i – m24-l, và = i – 24-l (2.18)
- 42 Nếu i hoặc j là một khối ranh giới trên mức 0, 0 < l <3, sau đó nút LS sẽ đƣợc lấy trung bình. LSl(i, j) = (2.19) Giá trị trung bình này không đƣợc tính cho các nút đƣờng biên ở mức dƣới cùng bởi nút Ll,m-1,n(16, j) đại diện cho một giá trị ngoại suy. Thay vào đó, chúng ta chỉ nói đơn giản: LS0(i, j) = L0,m,n(0, ) (2.20) Khôi phục lại thông qua quá trình mở rộng và tổng hợp đƣợc thấy trong hình 2.8b. Lƣu ý rằng các khối đƣờng biên gần nhƣ đã đƣợc loại bỏ hoàn toàn. Hình ảnh vẫn ở mức chất lƣợng thấp, nhƣng điều này là do tỉ lệ bit ban khối ban đầu trƣớc khi mã hõa so với kĩ thuật đan ghép. 2.2 TRÍCH CHỌN ĐẶC TRƢNG TRONG KHẢM ẢNH 2.2.1 Kĩ thuật trích chọn đặc trƣng Một bức ảnh mang rất nhiều thông tin nhƣ định dạng, kích thƣớc, màu sắc, độ tƣơng phản v.v Trong khảm ảnh với một tập ảnh mẫu rất lớn thì việc tra cứu các ảnh mẫu này với các vùng trên ảnh gốc gặp rất nhiều khó khăn. Vì vậy việc áp dụng kĩ thuật trích chọn đặc trƣng sẽ giúp ích rất nhiều cho việc khảm ảnh. Thông thƣờng đối với việc khảm ảnh thì chúng ta sẽ quan tâm nhiều đến một số đặc trƣng mà Tee Cheng Siew[4] ] và Lowe David [3] đã chỉ ra một số đặc trƣng nhƣ sau: Đặc trưng màu sắc: Màu sắc là một đặc trƣng nổi bật và đƣợc sử dụng phổ biến nhất trong tìm kiếm ảnh theo nội dung. Mỗi một điểm ảnh (thông tin màu sắc) có thể đƣợc biểu diễn nhƣ một điểm trong không gian màu sắc ba chiều. Các không gian màu sắc thƣờng dùng là: RGB, CIE, HSV Tìm kiếm ảnh theo màu sắc tiến hành tính toán biểu đồ màu cho mỗi ảnh để xác định tỉ trọng các điểm ảnh của ảnh mà chứa các giá trị màu. Các nghiên cứu gần đây đang cố gắng phân vùng ảnh theo các màu sắc khác nhau và tìm mỗi quan hệ giữa các vùng này. Đặc trưng kết cấu: Trích xuất nội dung ảnh theo kết cấu nhằm tìm ra mô hình trực quan của ảnh và cách thức chúng đƣợc xác định trong không gian. Kết cấu đƣợc biểu diễn bởi các texel mà sau đó đƣợc đặt vào một số các tập phụ thuộc vào số kết cấu
- 43 đƣợc phát hiện trong ảnh. Các tập này không chỉ xác định các kết cấu mà còn chỉ rõ vị trí các kết cấu trong ảnh. Việc xác định các kết cấu đặc biệt trong ảnh đạt đƣợc chủ yếu bằng cách mô hình các kết cấu nhƣ những biến thể cấp độ xám 2 chiều. Đặc trưng hình dạng: Hình dạng của một ảnh hay một vùng là một đặc trƣng quan trong trong việc xác định và phân biệt ảnh trong nhận dạng mẫu. Mục tiêu chính của biểu diễn hình dạng trong nhận dạng mẫu là đo thuộc tính hình học của một đối tƣợng đƣợc dùng trong phân lớp, so sánh và nhận dạng đối tƣợng. 2.2.1.1 Đặc trƣng màu sắc Tra cứu ảnh theo lƣợc đồ màu là phƣơng pháp phổ biến và đƣợc sử dụng nhiều nhất trong các hệ thống tìm kiếm ảnh theo nội dung. Đây là phƣơng pháp đơn giản, tốc độ tìm kiếm tƣơng đối nhanh tuy nhiên kết quả tìm kiếm có độ chính xác không cao. Đây có thể xem là bƣớc lọc đầu tiên cho những bƣớc tìm kiếm sau. Một số lƣợc đồ màu đƣợc sử dụng nhƣ: lƣợc đồ màu RGB, lƣợc đồ màu HSI, lƣợc đồ HSI cải tiến. Trong đó, lƣợc đồ màu RGB đƣợc sử dụng phổ biến nhất Hệ màu RGB: Đối với ảnh 256 màu, lƣợc đồ màu của ảnh tƣơng đƣơng với lƣợc đồ màu của ảnh xám. Đối với ảnh 24 bit màu, lƣợc đồ miêu tả khả năng kết nối về cƣờng độ của ba kênh màu R, G, B. Luợc đồ màu này đƣợc định nghĩa nhƣ sau: hR,G,B[r,g,b] = N* Prob{R=r,G=g,B=b} (2.21) Trong đó N là số lƣợng điểm ảnh. Lƣợc đồ màu này đƣợc tính bằng cách rời rạc hóa từng màu trong ảnh, sau đó đếm số điểm ảnh của mỗi màu. Khi mà số lƣợng màu là có hạng, để thuận tiện hơn, ngƣời ta thƣờng chuyển đổi ba kênh màu thành một biến giá trị duy nhất. Một cách khác để tính lƣợc đồ màu của ảnh RGB là ta phân ra làm 3 lƣợc đồ riêng biệt hR[], hG[], hB[]. Khi đó, mỗi lƣợc đồ đƣợc tính bằng cách đếm kênh màu tƣơng ứng trong mỗi điểm ảnh. Độ đo tƣơng đồng về màu sắc Một số độ đo tƣơng đồng đƣợc sử dụng nhƣ: Độ đo khoảng cách Ơclit, độ đo Jensen-Shannon divergence (JSD). Gọi h(I) và h(M) tƣơng ứng là 2 lƣợc đồ màu của hai ảnh I và ảnh M. Khi đó các loại độ đo màu đƣợc định nghĩa là một số nguyên (hoặc số thực) theo các loại độ đo tƣơng ứng nhƣ sau:
- 44 Khoảng cách Euclid: Intersection(h(I),h(M)) = (2.22) Hoặc: Intersection(h(I),h(M)) = (2.23) Độ đo Jensen-Shannon divergence: Độ đo Jensen-Shannon divergence sử dụng lƣợc đồ màu RGB để tính toán độ tƣơng đồng về màu sắc giữa 2 ảnh: dJSD(H, H’) = (2.24) Trong đó: H, H’ là 2 biểu đồ màu đƣợc so sánh, Hm là bin thứ m của biểu đồ H Độ đo khoảng cách Min-Max Đƣợc thực hiện dựa trên ý tƣởng lấy phần giao của 2 lƣợc đồ màu cần so sánh, ta sẽ đƣợc một lƣợc đồ, tính tổng các giá trị có đƣợc từ lƣợc đồ này cho ta đƣợc độ đo min-max. • Đối với độ đo min ta tính dựa vào giá trị min tại khác K bin: Intersection(h(I),h(M)) = (2.25) • Tƣơng tự đối với độ đo Max: Intersection(h(I),h(M)) = (2.26) Matching(h(I),h(M)) = (2.27) 2.2.1.2 Đặc trƣng kết cấu Kết cấu cung cấp thông tin về sự sắp xếp về mặt không gian của màu sắc và cƣờng độ một ảnh. Kết cấu đƣợc đặc trƣng bởi sự phân bổ không gian của những mức cƣờng độ trong một khu vực lân cận với nhau. Kết cấu gồm các kết cấu gốc hay nhiều kết cấu gộp lại đôi khi gọi là texel. Có một số phƣơng pháp dụng để trích xuất các đặc trƣng kết cấu nhƣ : • Phƣơng pháp hình chóp • Biến đổi đƣờng viền • Biến đổi sóng Gabor
- 45 • Biểu diễn ma trận đồng hiện 2.2.1.3 Đặc trƣng hình dạng Màu sắc và kết cấu là những thuộc tính mang tính toàn cục trong một ảnh. Trong khi đó, hình dạng không phải là một thuộc tính của ảnh. Nói tới hình dạng của hình ảnh là chỉ đến một khu vực đặc biệt trong ảnh, hay hình dạng chỉ là biên của một đối tƣợng nào đó trong ảnh. Trong tra cứu ảnh theo nội dung, hình dạng là một cấp cao hơn so với màu sắc và kết cấu. Nó đòi hỏi sự phân biệt giữa các vùng để tiến hành xử lý về độ đo của hình dạng. Các hệ thống tra cứu ảnh theo nội dung thƣờng khai thác hai nhóm biểu diễn hình dạng sau : • Biểu diễn hình dạng theo đƣờng biên (cotour-based descriptor): Biểu diễn các đƣờng biên bao bên ngoài. • Biểu diễn theo vùng (region-based descriptor): Biểu diễn một vùng toàn vẹn. Độ đo về hình dạng rất nhiều trong phạm vi lý thuyết của bộ môn xử lý ảnh. Chúng trải rộng từ những độ đo toàn cục dạng thô với sự trợ giúp của việc nhận dạng đối tƣợng, cho tới những độ đo chi tiết tự động tìm kiếm những hình dạng đặc biệt. Lƣợc đồ hình dạng là một ví dụ của độ đo đơn giản. Kỹ thuật dùng đƣờng biên hiệu quả hơn phƣơng pháp trƣớc, chúng tìm kiếm những hình dạng đối tƣợng gần giống với đƣờng biên nhất. Phƣơng pháp vẽ phác họa là phƣơng pháp có nhiều đặc trƣng rõ ràng hơn, không chỉ tìm kiếm những đƣờng biên đối tƣợng đơn, mà còn đối với tập những đối tƣợng đã đƣợc phân đoạn trong một ảnh mà ngƣời dùng vẽ hay cung cấp. 2.2.1.4 Đặc trƣng cục bộ bất biến Ngƣời ta thƣờng chia đặc trƣng cụ bộ thành 2 loại là những điểm trích xuất đƣợc từ ―điểm nhô ra" (salient points) của ảnh và đặc trƣng SIFT đƣợc trích chọn từ các điểm hấp dẫn Haris (interest points). Trong phần này, chúng ta sẽ trình bày chi tiết về việc trích chọn các đặc trƣng cục bộ bất biến (Scale Invariant Feature Transform) của ảnh[3]. Các đặc trƣng này bất biến với việc thay đổi tỉ lệ ảnh, quay ảnh, đôi khi là thay đổi điểm nhìn và thêm nhiễu ảnh hay thay đổi cƣờng độ chiếu sáng của ảnh. Phƣơng pháp đƣợc lựa chọn có tên là Scale-Invariant Feature Transform và đặc trƣng trích rút
- 46 đựợc gọi là đặc trƣng SIFT (SIFT Feature). Các đặc trƣng SIFT này đƣợc trích rút ra từ các điểm hấp dẫn cục bộ (Local Interest Point) Phƣơng pháp trích chọn các đặc trƣng bất biến SIFT đƣợc tiếp cận theo phƣơng pháp thác lọc, theo đó phƣơng pháp đƣợc thực hiện lần lƣợt theo các bƣớc sau[3]: • Phát hiện các điểm cực trị Scale-Space (Scale-Space extrema detection): Bƣớc đầu tiên này tiến hành tìm kiếm các điểm hấp dẫn trên tất cả các tỉ lệ và vị trí của ảnh. Nó sử dụng hàm different-of-Gaussian để xác định tất cả các điểm hấp dẫn tiềm năng mà bất biến với quy mô và hƣớng của ảnh. • Định vị các điểm hấp dẫn (keypoint localization): Một hàm kiểm tra sẽ đƣợc đƣa ra để quyết định xem các điểm hấp dẫn tiềm năng có đƣợc lựa chọn hay không? • Xác định hƣớng cho các điểm hấp dẫn (Orientation assignment): Xác định hƣớng cho các điểm hấp dẫn đƣợc chọn • Mô tả các điểm hấp dẫn (Keypoint descriptor): Các điểm hấp dẫn sau khi đƣợc xác định hƣớng sẽ đƣợc mô tả dƣới dạng các vector đặc trƣng nhiều chiều. Phát hiện điểm cực trị Scale-space Các điểm hấp dẫn với đặc trƣng SIFT tƣơng thích với các cực trị địa phƣơng của bộ lọc difference-of-Gaussian (DoG) ở các tỉ lệ khác nhau. Định nghĩa không gian tỉ lệ của một hình ảnh là hàm L(x,y,kσ) đƣợc mô tả nhƣ sau: L(x,y,σ) = G(x,y,kσ)*I(x,y) (2.28) Với : G(x,y,kσ) : biến tỉ lệ Gaussian (variable scale Gaussian) I(x,y): Ảnh đầu vào * là phép nhân chập giữa x và y Và : G(x,y,σ) = (2.29) Để phát hiện đƣợc các điểm hấp dẫn, ta đi tìm các cực trị của hàm DoG đƣợc định nghĩa: D(x,y,σ) = (G(x,y,kσ) - G(x,y,σ))*I(x,y) (2.30) D(x,y,σ) = L(x,y,kσ) - L(x,y,σ) (2.31)
- 47 Giá trị hàm DoG đƣợc tính xấp xỉ dựa vào giá trị Scale-normalized Laplacian of Gaussian ( ) thông qua các phƣơng trình (2.28),(2.29),(2.31) (2.32) (2.33) G(x,y,kσ) - G(x,y,σ) (7) (2.34) Nhƣ vậy, bƣớc đầu tiên của giải thuật SIFT phát hiện các điểm hấp dẫn với bộ lọc Gaussian ở các tỉ lệ khác nhau và các ảnh GoG từ sự khác nhau của các ảnh kề mờ. Hình 2.9: Biểu đồ mô phỏng việc tính toán các DoG ảnh từ các ảnh kề mờ Các ảnh cuộn đƣợc nhóm thành các octave (mỗi octave tƣơng ứng với giá trị gấp đôi của ). Giá trị của k đƣợc chọn sao cho số lƣợng ảnh đã làm mờ (blured images) cho mỗi octave là cố định. Điều này đảm bảo cho số lƣợng các ảnh DoG cho mỗi octave không thay đổi. Các điểm hấp dẫn đƣợc xác định là các cực đại hoặc cực tiểu của các ảnh DoG qua các tỉ lệ. Mỗi điểm ảnh trong DoG đƣợc so sánh với 8 điểm ảnh láng giềng của nó ở cùng tỉ lệ đó và 9 láng giềng kề ở các tỉ lệ ngay trƣớc và sau nó. Nếu điểm ảnh đó đạt giá trị cực tiểu hoặc cực đại thì sẽ đƣợc chọn làm các điểm hấp dẫn phù hợp
- 48 . Hình 2.10: Mỗi điểm ảnh đƣợc so sánh với 26 láng giềng của nó. Định vị điểm hấp dẫn Mỗi điểm hấp dẫn sau khi đƣợc chọn sẽ đƣợc đánh giá xem có đƣợc giữ lại hay không: • Loại bỏ các điểm hấp dẫn có độ tƣơng phản thấp • Một số điểm hấp dẫn dọc theo các cạnh không giữ đƣợc tính ổn định khi ảnh bị nhiễu cũng bị loại bỏ. Các điểm hấp dẫn còn lại sẽ đƣợc xác định hƣớng. Hình 2.11: Quá trình lựa chọn các điểm hấp dẫn
- 49 Xác định hƣớng cho điểm hấp dẫn Để xác định hƣớng cho các điểm hấp dẫn, ngƣời ta tính toán biểu đồ hƣớng Gradient trong vùng láng giềng của điểm hấp dẫn. Độ lớn và hƣớng của các điểm hấp dẫn đƣợc xác định theo công thức: m(x,y) = (2.35) (2.36) Biểu diễn vector cho điểm hấp dẫn Điểm hấp dẫn sau khi đƣợc xác định hƣớng sẽ đƣợc biểu diễn dƣới dạng các vector 4x4x8=128 chiều. Hình 2.12: Biểu diễn các vector đặc trƣng Đo độ tƣơng đồng cho đặc trƣng cục bộ bất biến Một số độ đo tƣơng đồng cho ảnh sử dụng đặc trƣng SIFT nhƣ : • Độ đo Cosin: d(x,y) = (2.37) • Khoảng cách góc: d(x,y) = (2.38)
- 50 • Độ đo Euclide: d(x,y) = (2.39) • Độ đo Jensen-Shannon divergence: dJSD(H,H’) = (2.40) Với H, H’ là 2 biểu đồ biểu dễn các vector đặc trƣng SIFT Lựa chọn đặc trƣng Sau khi trích chọn đƣợc các đặc trƣng nội dung của ảnh, tập các đặc trƣng có thể đƣợc tối ƣu hóa bằng các phƣơng pháp lựa chọn đặc trƣng để tăng chất lƣợng và hiệu quả khi sử dụng các tập đặc trƣng. Một cách tổng quát, lựa chọn đặc trƣng là phƣơng pháp giảm thiểu các đặc trƣng nhằm chọn ra một tập con các đặc trƣng phù hợp trong học máy để xây dựng mô hình học tốt nhất. Mục đích của lựa chọn đặc trƣng là tìm ra không gian con các đặc trƣng tối ƣu sao cho các tập ảnh ―thích hợp‖ và ―không thích hợp‖ đƣợc tách biệt nhất. Có nhiều phƣơng pháp lựa chọn đặc trƣng đƣợc đề xuất nhƣ: phƣơng pháp tăng khuếch đại (boosting manner) kết hợp với nền tảng Real Adaboost của Wei Jian và Guihua Er. Mingjing Li đƣa ra tiêu chí lựa chọn các đặc trƣng là: Mô hình tƣơng phản đặc trƣng đƣợc tổng quát hóa (Generalized Feature Contrast Model) dựa trên mô hình tƣơng phản đặc trƣng (Feature Contrast Model). Một số phƣơng pháp cổ điển khác nhƣ phƣơng pháp dựa vào phân phối (distribution based). Phƣơng pháp dựa vào phân tích biệt thức (Discriminant analysis DA) ví dụ nhƣ phân tích đa biệt thức (Mutiple Discriminant analysis MDA), phân tích biệt thức không đối xứng (biased Discriminant analysis BDA). Phƣơng pháp tối đa khoảng cách tối thiểu đối xứng trong không gian con (symmetric maximized minimal distance in subspace SMMS) Có nhiều phƣơng pháp để đánh giá kết quả của tập con các đặc trƣng. Vì vậy, kết quả đối với những mô hình lựa chọn đặc trƣng khác nhau là khác nhau. Hai mô hình phổ biến cho lựa chọn đặc trƣng là: Mô hình Filter và mô hình Wrapper[4]. • Mô hình Filter: đánh giá mỗi phần tử bằng một vài tiêu chuẩn hay độ đo nào đó, rồi chọn ra tập con các thuộc tính đƣợc đánh giá cao nhất.
- 51 • Mô hình Wrapper: Sử dụng một thuật toán tìm kiếm để đánh giá tập con các thuộc tính coi nhƣ là một nhóm hơn là một phần tử riêng lẻ. Cốt lõi của mô hình Wrapper là một thuật toán học máy cụ thể. Nó đánh giá độ tốt của những tập con đặc trƣng tùy theo độ chính xác học của tập con, điều này xác định thông qua một tiêu chí nào đó. 2.2.2 Ứng dụng kĩ thuật trích chọn đặc trƣng trong khảm ảnh Khác với kĩ thuật đan đa phân giải là ứng dụng để khảm ảnh toàn cảnh, kĩ thuật trích chọn đặc trƣng ảnh đƣợc ứng dụng để khảm ảnh nhiều lớp. Việc cần làm đối với ảnh khảm nhiều lớp đó là sử dụng các lƣới để chia ảnh nguồn ra nhiều phần bằng nhau và mỗi phần này chính là kích thƣớc của các tập ảnh mẫu. Tuy nhiên không phải lúc nào cũng nhƣ vậy. Đối với một số kĩ thuật nâng cao thì các lƣới này sẽ có dạng tùy ý dựa vào kết cấu của ảnh nguồn. Ví dụ nhƣ ảnh 1.21 ảnh quảng cáo của hãng IKA. Ảnh đƣợc tạo thành từ nhiều mẫu có kích thƣớc khác nhau. Với những ảnh kiểu này đòi hỏi kĩ thuật rất cao. Hiện giờ đa số các phần mềm khảm ảnh đều chia ảnh bởi các lƣới đều nhau là các hình vuông hoặc chữ nhật. Quy trình khảm ảnh gồm các bƣớc sau: Bước 1: Chuẩn bị ảnh nguồn (nên chỉnh lại cỡ ảnh sao cho kích thƣớc nó là bội số của kích thƣớc các tập ảnh mẫu) và tập ảnh mẫu (tập ảnh mẫu này đƣợc lƣu cùng một thƣ mục) Bước 2: Chia ảnh nguồn bằng các lƣới, các lƣới này là các lƣới có mắt hình vuông hoặc chữ nhật, và lƣới này là bội số của các mẫu. Lƣới có kích thƣớc càng nhỏ thì ảnh khảm càng có chất lƣợng tốt. Bước 3: Duyệt từng vùng (các mắt lƣới) của ảnh nguồn. Sử dụng kĩ thuật trích chọn đặc trƣng để so sánh từng vùng đó với tất cả các ảnh trong tập ảnh mẫu để tìm ra ảnh mẫu phù hợp nhất (có màu sắc tƣơng ứng, kết cấu tƣơng ứng ). Gán ảnh mẫu phù hợp vào vị trí của vùng tƣơng ứng. Vì khảm ảnh nhiều lớp đƣợc ghép từ nhiều ảnh có nội dung khác nhau. Nên không giống nhƣ ảnh khảm toàn cảnh, nó không cần phải làm mịn đƣờng biên và cân bằng màu sắc, độ tƣơng phản, nên có thể nói ở bƣớc này khảm ảnh nhiều lớp nhàn hơn một chút.
- 52 CHƢƠNG 3: CHƢƠNG TRÌNH THỬ NGHIỆM 3.1 Bài toán Chƣơng trình khảm ảnh đƣợc xây dựng để minh họa cho phƣơng pháp khảm ảnh nhiều lớp dựa trên việc trích chọn đặc trƣng của ảnh số. • Đầu vào : Một ảnh lớn và một tập ảnh nhỏ dùng làm mẫu. • Đầu ra: Ảnh lớn đƣợc ghép từ nhiều ảnh nhỏ trong tập ảnh mẫu đó sao cho nhìn một cách khái quát thì vẫn có thể thấy đƣợc nội dung của bức ảnh lớn. 3.2 Phân tích, thiết kế Hoạt động của chƣơng trình : Bước 1: Đƣa vào chƣơng trình một ảnh lớn định dạng jpg, và một tập các ảnh nhỏ có kích thƣớc bằng nhau. Bước 2: Chƣơng trình sẽ trích chọn đặc trƣng về màu sắc của các ảnh nhỏ này Bước 3: Ảnh nguồn sẽ đƣợc chỉnh lại kích thƣớc sao cho kích thƣớc của nó là bội số của kích thƣớc các ảnh nhỏ. Bước 4: Chƣơng trình chi ảnh lớn thành các ảnh nhỏ có kích thƣớc bằng các ảnh nhỏ đƣợc dùng làm mẫu, đồng thời trích chọn đặc trƣng của các phần nhỏ sau khi đƣợc chia ra từ ảnh lớn rồi đem so sánh với đặc trƣng về màu của từng ảnh trong tập ảnh mẫu (sử dụng độ đo Euclid) để chọn ra ảnh tƣơng đồng về màu sắc và thay thế cho nó. Bước 5: Ghép lại các ảnh nhỏ sau khi đƣợc thay thế để tạo ra ảnh khảm. Chƣơng trình cần phải có một số các chức năng chính nhƣ sau: 1. Đọc và hiển thị ảnh. 2. Lấy đƣờng dẫn của tập ảnh mẫu. 3. Xử lý và hiển thị kết quả.
- 53 3.3 Chƣơng trình khảm ảnh Chƣơng trình đƣợc xây dựng bằng bộ công cụ Visual Studio 2008 sử dụng ngôn ngữ lập trình C#. Có 2 tập ảnh mẫu dùng để khảm ảnh gồm 1000 ảnh jpg kích thƣớc 50x50 và 1000 ảnh jpg kích thƣớc 20x20. Chƣơng trình sử dụng phƣơng pháp trích chọn đặc trƣng về màu sắc để tìm ra ảnh tƣơng đồng cho các vùng trên ảnh gốc. Nhóm các modul chính của chƣơng trình: 1. Chọn và hiển thị ảnh nguồn dùng để khảm 2. Chọn thƣ mục chứa ảnh mẫu 3. Xử lý để cho ra ảnh khảm và hiển thị ảnh khảm sau khi đƣợc xử lý. Một số giao diện chính của chƣơng trình: Hình 3.1: Giao diện chƣơng trình khi khởi động
- 54 Hình 3.2: Giao diện chƣơng trình sau khi chọn ảnh nguồn dùng để khảm
- 55 Hình 3.3: Chọn thƣ mục chứa tập ảnh mẫu.
- 56 Một số kết quả thu đƣợc: Hình 3.4: Ảnh khảm sử dụng ảnh mẫu kích thƣớc 20x20 Hình 3.5: Ảnh khảm sử dụng ảnh mẫu kích thƣớc 50x50
- 57 Hình 3.6: Hình ảnh phong cảnh đƣợc khảm từ tập ảnh mẫu 50x50 Hình 3.7: Hình ảnh phong cảnh đƣợc khảm từ tập ảnh mẫu 20x20 Qua hình 3.4, 3.5, 3.6, 3.7 có thể thấy chỉ có rất ít những ảnh nhỏ có màu sắc tƣơng đồng với vị trí tƣơng ứng của nó trên ảnh gốc. Điều này chứng tỏ thuật toán và phƣơng pháp tạo hình khảm còn rất nhiều sai sót.
- 58 KẾT LUẬN Ngày nay, cùng với sự phát triển mạnh mẽ về mọi mặt của công nghệ thông tin, truyền thông thì xử lý ảnh cùng với các phạm trù của nó cũng có sự phát triển nhanh chóng và đóng một vai trò quan trọng trong nhiều lĩnh vực. Khảm ảnh chính là một trong các phạm trù đó. Nội dung đồ án đã chỉ ra đƣợc một số các khái niệm và kĩ thuật khảm ảnh. Chƣơng trình thử nghiệm khảm ảnh do em xây dựng từ một trong các kĩ thuật tìm hiểu đƣợc đã có thể tạo ra ảnh khảm từ nhiều ảnh nhỏ nhƣng chƣơng trình chƣa đƣợc hoàn chỉnh do kết quả thu đƣợc không chính xác. Với kết quả thu đƣợc nhƣ vậy có thể do rất nhiều các nguyên nhân khác nhau và chƣơng trình cần đƣợc xem xét lại một cách kĩ lƣỡng để có thể hoàn chỉnh hơn. Mặc dù đã hoàn thành đƣợc mục tiêu chính của đồ án nhƣng do điều kiện về thời gian có hạn mà lĩnh vực cần tìm hiểu cũng tƣơng đối rộng nên những gì tìm hiểu đƣợc trong đồ án sẽ khó tránh khỏi những thiếu xót. Chƣơng trình thử nghiệm cũng chƣa thực sự hoàn thiện nhƣng đó cũng là một kết quả khả quan. Trong thời gian tới nếu có điều kiện em sẽ tìm hiểu thêm và có thể sẽ xây dựng một chƣơng trình thử nghiệm về khảm ảnh hoàn chỉnh hơn.
- 59 TÀI LIỆU THAM KHẢO Tài liệu Tiếng Việt [1]. Đỗ Năng Toàn, Phạm Việt Bình (2007), Giáo trình xử lý ảnh, Nhà xuất bản Đại học Thái Nguyên. [2]. Lƣơng Mạnh Bá, Nguyễn Thanh Thủy (2007), Nhập môn xử lý ảnh số, Nhà xuất bản KHKT. Tài liệu Tiếng Anh [3]. Lowe David(2004). Distinctive image features from scale-invariant keypoints. International Journal of Computer Vision 2004 [4]. Tee Cheng Siew(2008). Feature selection for content-based image retrieval using statistical discriminant analysis. PhD thesis Faculty of Computer Science and Information System Universiti Teknologi Malaysia. 2008 [5]. PETER J. BURT and EDWARD H. ADELSONRCA, A Multiresolution Spline With Application to Image Mosaics, David Sarnoff Research Center. Website [6]. [7]. [8].
- 60 PHỤ LỤC 1. Hệ thống màu HSI Hệ thống màu HSI mã hóa thông tin màu sắc bằng cách chia giá trị intensity I từ hai giá trị đƣợc mã hóa thuộc về độ hội tụ của màu hue H và saturation S. Thành phần không gian màu HSI gồm có ba phần: - Hue đƣợc định nghĩa có giá trị 0-2Π, mang thông tin về màu sắc. - Saturation có giá trị 0-1, mang giá trị về độ thuần khiết của thành phần Hue. - Intensity(Value) mang thông tin về độ sáng của điểm ảnh. Ta có thể hình dung không gian màu HSI nhƣ là vật hình nón. Với trục chính biểu thị cƣờng độ sáng Intensity. Khoảng cách đến trục biểu thị độ tập chung Saturation. Góc xung quanh trục biểu thị cho sắc màu Hue. Đôi khi, hệ thống màu HSI đƣợc coi nhƣ là hệ thống màu HSV dùng Value thay vì Intensity. Hệ thống màu HSI thì thích hợp hơn với một số thiết kế đồ họa bởi vì nó cung cấp sự điều khiển trực tiếp đến ánh sáng và hue. Hệ thống màu HSI cũng hỗ trợ tốt hơn cho những thuật toán xử lý ảnh vì sự tiêu chuẩn hóa về ánh sáng và tập chung vào hai tham số về độ hội tụ màu,và cƣờng độ màu . Hình 1: Hệ màu HIS
- 61 Hình 2 : Không gian màu HSI Hệ thống màu HSI có sự phân chia rõ rệt giữa ánh sáng và màu sắc. Do đó có khả năng rất lớn đƣợc áp dụng cho việc tính đặc trƣng và so sánh sự giống nhau về màu sắc của hai ảnh. Do đó nó rất thích hợp cho việc tìm kiếm ảnh dựa vào màu. Sự giống và khác nhau giữa hai ảnh về mặt màu sắc đối với mắt ngƣời chỉ mang ý nghĩa tƣơng đối. Do đó khi áp dụng vào bài toán này trên máy tính thì ta cũng giả lập sự tƣơng đối này. Phƣơng pháp chính của việc tìm kiếm theo màu sắc là dùng lƣợc đồ màu để làm đặc trƣng cho từng ảnh. Do những đặc điểm riêng của mô hình màu HSI và đặc trƣng của việc tìm kiếm nên tính lƣợc đồ màu cũng đƣợc dùng một mô mình rất đặc biệt để phù hợp cho những đặc điểm 2. Hệ thống màu CMYK Từ CMYK (hay đôi khi là YMCK) là từ viết tắt trong tiếng Anh để chỉ mô hình màu loại trừ sử dụng trong in ấn màu. Mô hình màu này dựa trên cơ sở trộn các chất màu của các màu sau: C=Cyan trong tiếng Anh có nghĩa là màu xanh lơ M=Magenta trong tiếng Anh có nghĩa là màu hồng sẫm Y=Yellow trong tiếng Anh có nghĩa là màu vàng
- 62 K=Key (trong tiếng Anh nên hiểu theo nghĩa là cái gì đó then chốt hay chủ yếu để ám chỉ màu đen mặc dù màu này có tên tiếng Anh là black do chữ B đã đƣợc sử dụng để chỉ màu xanh lam (blue) trong mô hình màu RGB để tạo các màu khác. Hỗn hợp của các màu CMY lý tƣởng là loại trừ (các màu này khi in cùng một chỗ trên nền trắng sẽ tạo ra màu đen). Nguyên lý làm việc của CMYK là trên cơ sở hấp thụ ánh sáng. Màu mà ngƣời ta nhìn thấy là từ phần của ánh sáng không bị hấp thụ. Trong CMYK hồng sẫm cộng với vàng sẽ cho màu đỏ, hồng sẫm cộng với xanh lơ cho màu xanh lam, xanh lơ cộng với vàng sinh ra màu xanh lá cây và tổ hợp của các màu xanh lơ, hồng sẫm và vàng tạo ra màu đen. Hệ thống màu CMY dƣờng nhƣ là một sự đảo ngƣợc của hệ thống màu RGB. Đặc tính của nó là sự đơn giản, ứng dụng nhiều trong thực tế. Tuy nhiên khuyết điểm của nó cũng tƣơng tự nhƣ không gian màu RGB, tức là cách mã hóa khác với cách mà con ngƣời cảm nhận về màu sắc không tƣơng thích với việc so sánh nội dung các ảnh.