Giáo trình Một kỹ thuật định vị các điểm điều khiển trên khuôn mặt dựa trên mô hình chất liệu - Lê Thị Kim Nga

7 trang huongle 4910

Download

Bạn đang xem tài liệu "Giáo trình Một kỹ thuật định vị các điểm điều khiển trên khuôn mặt dựa trên mô hình chất liệu - Lê Thị Kim Nga", để tải tài liệu gốc về máy bạn click vào nút DOWNLOAD ở trên

Tài liệu đính kèm:

giao_trinh_mot_ky_thuat_dinh_vi_cac_diem_dieu_khien_tren_khu.pdf

Nội dung text: Giáo trình Một kỹ thuật định vị các điểm điều khiển trên khuôn mặt dựa trên mô hình chất liệu - Lê Thị Kim Nga

Kỷ yếu Hội nghị Quốc gia lần thứ VIII về Nghiên cứu cơ bản và ứng dụng Công nghệ thông tin (FAIR); Hà Nội, ngày 9-10/7/2015 MỘT KỸ THUẬT ĐỊNH VỊ CÁC ĐIỂM ĐIỀU KHIỂN TRÊN KHUÔN MẶT DỰA TRÊN MÔ HÌNH CHẤT LIỆU 1 2 3 4 Lê Thị Kim Nga , Phạm Trần Thiện , Hà Mạnh Toàn , Lâm Thành Hiển 1 Khoa Công nghệ thông tin, Đại học Quy Nhơn 2 Phòng Tổ chức Cán bộ, Đại học Quy Nhơn 3Viện Công nghệ thông tin, Viện Hàn lâm Khoa học và Công nghệ Việt Nam 4Trường Đại học Lạc Hồng kimnga78@gmail.com, ,phamtranthien@qnu.edu.vn, lthien70@yahoo.com TÓM TẮT - Một trong những khâu quan trọng trong nhận dạng biểu cảm khuôn mặt là định vị chính xác được các điểm điều khiển thể hiện trạng thái khuôn mặt. Bài báo này đề cập đến việc xây dựng các ràng buộc vị trí cho các điểm điều khiển dựa trên mô hình chất liệu mặt có tính thích nghi. Nhờ các ràng buộc này, các điểm điều khiển sẽ được định vị chính xác và nhanh hơn trong quá trình dò tìm sau đó. Kỹ thuật đã được cài đặt thử nghiệm và tỏ ra có hiệu quả trong việc nhận dạng biểu cảm khuôn mặt, ngay cả trong những điều kiện ánh sáng và nền phức tạp. Từ khóa - Facial expression recognition, emotion recognition, facial material, active appearance model I. GIỚI THIỆU Ngày nay, nhờ sự phát triển của khoa học công nghệ và sự phổ biến của thông tin từ các phương tiện truyền thông, mọi người đã dần biết đến các hệ thống phân tích ảnh khuôn mặt như hệ thống an ninh sử dụng nhận dạng khuôn mặt, các hệ thống cho phép con người tương tác thông qua biểu cảm khuôn mặt cũng như các công cụ để thực hiện việc biến đổi hình ảnh mặt rất thường thấy trong các bộ phim kinh dị, viễn tưởng Trong các hệ thống như vậy, một vấn đề quan trọng được đặt ra là trích chọn đặc trưng biểu cảm khuôn mặt. Hiểu một cách đơn giản, đây chính là thao tác xác định chính xác các điểm điều khiển thể hiện trạng thái khuôn mặt. Như chúng ta đã biết, đối tượng có thể được mô tả bởi một tập các điểm điều khiển. Khuôn mặt là loại đối tượng mà chính bản thân nó tự biến đổi do trạng thái biểu cảm tự nhiên của con người, cùng với sự ảnh hưởng bởi điều kiện thu nhận như ánh sáng, kiểu chụp cũng như màu da của mỗi chủng tộc khác nhau. Do đó việc trích chọn các điểm điều khiển cho đối tượng khuôn mặt một cách chính xác là vấn đề được quan tâm nghiên cứu của nhiều tác giả. Một số nghiên cứu cải tiến thuật toán trích chọn điểm điều khiển khuôn mặt AAM (Active Apperance Models) kết hợp với thông tin 2D và 3D [1] như hình 1. Hình 1. Trích chọn các điểm điều khiển trên khuôn mặt dựa vào AAM cải tiến. Việc trích chọn các điểm điều khiển trên khuôn mặt chính xác có thể đóng nhiều vai trò khác nhau trong các hệ thống phân tích ảnh khuôn mặt nói chung và bài toán phân tích biểu cảm khuôn mặt nói riêng. Nghiên cứu về biểu cảm khuôn mặt và thể hiện biểu cảm của khuôn mặt là một công việc quan trọng và đang được sự quan tâm của nhiều nhà khoa học trong các lĩnh vực khác nhau từ các nghệ sỹ hội họa điêu khắc đến các nhà khoa học nghiên cứu về nhân học cho đến những nhà khoa học trong lĩnh vực công nghệ thông tin. Điều này xuất phát từ hai lý do chính: một là khả năng ứng dụng các kết quả nghiên cứu vào thực tiễn, hai là mặc dù đã có rất nhiều công trình nghiên cứu về biểu cảm và thể hiện biểu cảm khuôn mặt nhưng chưa có nghiên cứu nào thực sự hoàn thiện và phù hợp cho nhiều lớp bài toán khác nhau, mỗi hướng tiếp cận chủ yếu được đưa ra để giải quyết một vấn đề nào đó được đặt ra. Đặc biệt hơn các nghiên cứu về biểu cảm khuôn mặt và thể hiện biểu cảm khuôn mặt của người Việt còn rất hạn chế nếu không muốn nói là hầu như không có. Trên thế giới có rất nhiều công trình khoa học nghiên cứu về việc trích chọn các điểm đặc trưng thể hiện biểu cảm của khuôn mặt và tập trung theo hai hướng nghiên cứu chính. Một là trích chọn các đặc trưng biểu cảm khuôn mặt dựa trên các điểm đánh dấu. Với hướng này người ta cũng chia thành nhiều hướng con khác tùy vào cách lựa chọn loại điểm đánh dấu, hay số lượng camera quan sát một hoặc nhiều camera. Hướng nghiên cứu thứ hai đang được tập trung nghiên cứu nhiều trong thời gian gần đây là hướng nghiên cứu để trích chọn đặc trưng mà không sử dụng các điểm
MỘT KỸ THUẬT ĐỊNH VỊ CÁC ĐIỂM ĐIỀU KHIỂN TRÊN KHUÔN MẶT DỰA TRÊN MÔ HÌNH CHẤT LIỆU 397 đánh dấu. Với hướng nghiên cứu này có thể có một số cách tiếp cận như sử dụng các bộ học để đoán nhận biểu cảm khuôn mặt trên ảnh từ đó tính được các đặc trưng biểu cảm, hoặc sử dụng mô hình AAM (Active Appearance Model) [3] để nội suy hình dạng của khuôn mặt từ đó trích rút được các đặc trưng biểu cảm của khuôn mặt [9][10]. Hiện nay, nghiên cứu về chất liệu là một vấn đề đang được quan tâm trong lĩnh vực Thị giác máy. Có thể hiểu chất liệu của một đối tượng chính là thành phần bao phủ bên ngoài của đối tượng đó, là thành phần không thể thiếu được của mỗi đối tượng. Một số nhóm nghiên cứu theo hướng chất liệu như E. H. Adelson [11], L. B. Sharan [12], K. M. Henry [13]. Bản thân nhóm tác giả cũng đã có một số nghiên cứu về chất liệu như phát hiện chất liệu dựa vào đặc trưng bất biến địa phương [18], phát hiện chất liệu dựa vào hình học Fractal [19]. Báo cáo này đề xuất một kỹ thuật định vị các điểm điều khiển trên khuôn mặt dựa vào các ràng buộc trên cơ sở giới hạn bởi mô hình chất liệu mặt. Định vị các điểm điều khiển trên khuôn mặt dựa vào mô hình chất liệu là một hướng tiếp cận đầy hứa hẹn. Phần tiếp theo của bài báo là kỹ thuật xác định điểm đặc trưng khuôn mặt dựa trên tiếp cận chất liệu với một số vấn đề chi tiết hơn đó là kỹ thuật tách vùng mặt dựa trên mô hình chất liệu mặt trên cơ sở ước lượng màu da dựa trên tỉ lệ và định vị tập điểm điều khiển trên khuôn mặt dựa vào thuật toán tối ưu hóa mô hình xuất hiện tích cực (Active Apperance Models). Phần 3 sẽ là thử nghiệm, đánh giá kết quả và cuối cùng là phần kết luận. II. ĐỊNH VỊ CÁC ĐIỂM ĐIỀU KHIỂN TRÊN KHUÔN MẶT A. Thuật toán định vị các điểm điều khiển trên khuôn mặt AAM (Active Apperance Models) AAM (active appearance model) [3] là một thuật toán phổ biến trong lĩnh vực thị giác máy nhằm mục tiêu tối ưu một mô hình thống kê hình ảnh thể hiện của đối tượng vào một ảnh đầu vào mới, kết quả của quá trình tối ưu là một bộ điểm điều khiển thể hiện cấu trúc của đối tượng đã được học với các tọa độ tương ứng với thể hiện trong ảnh đầu vào của đối tượng cùng với nó là một bộ các tham số mô hình thống kê đã được ước lượng mà từ những tham số mô hình này, ta có thể dễ dàng tái cấu trúc cả về hình dạng cũng như kết cấu hình ảnh của đối tượng tương ứng một cách tương đối với thể hiện của đối tượng ở trong ảnh thử nghiệm. Trong AAM, đối tượng quan tâm được mô hình hóa bởi một tập điểm mô tả hình dạng và kết cấu hình ảnh của nó, kết cấu hình ảnh được lấy chính là mẫu của những giá trị cường độ ảnh trong những vùng được giới hạn bởi tập điểm điều khiển. Mô hình thống kê của đối tượng đảm bảo có thể mô tả được những biến thể về hình dạng và những biến thể về kết cấu hình ảnh cũng như mối tương quan giữa chúng. Các vấn đề nổi bật được quan tâm trong phương pháp này là việc xây dựng mô hình thống kê cho đối tượng ảnh và việc thiết kế thuật toán tối ưu để thực hiện tìm kiếm. Xây dựng mô hình thống kê toán học cho đối tượng bao gồm việc xây dựng mô hình thống kê toán học cho hình dạng, mô hình thống kê toán học cho kết cấu hình ảnh và việc kết hợp hai mô hình đó để ra được mô hình cho đối tượng. Mô hình hình dạng của đối tượng được biểu diễn bởi một tập hợp có thứ tự các điểm điều khiển. Một vấn đề quan trọng trong xây dựng mô hình chính là việc cần thiết phải lựa chọn được ra những điểm điều khiển phù hợp với loại đối tượng cần được mô hình hóa. Khi xây dựng tập dữ liệu huấn luyện, tập dữ liệu bao gồm một tập ảnh của đối tượng cùng với thông tin đánh dấu tập điểm điều khiển mô tả thể hiện của đối tượng được quan tâm tương ứng trong các ảnh. Đối tượng hình học chính là tập hợp có đánh thứ tự của các điểm điều khiển mô tả hình dạng của đối tượng ảnh được quan tâm, được biểu diễn bởi n điểm trong không gian d chiều, được thể hiện bằng một vector nd chiều với các giá trị trong vector chính giá trị tọa độ cụ thể trên từng trục không gian của từng điểm. Ví dụ, trong ảnh 2 chiều, ta {()} = ()T có thể mô tả n điểm điều khiển, xi , yi , thành vector 2n thành phần: x x1 , , xn , y1 , , yn . Sau khi thể hiện lại các đối tượng hình dạng thành các vector tương ứng, thực hiện mô hình hóa trên dữ liệu là tập các vector này. Bước đầu là thực hiện chuẩn hóa các đối tượng hình dạng này vào chung một không gian tọa độ nhằm chuẩn hóa các đối tượng hình dạng để tổng các khoảng cách của mỗi đối tượng hình dạng tới kỳ vọng của chúng ⎛ n 2 ⎞ = ⎜ − ⎟ D ∑ xi x đạt cực tiểu dựa trên PCA. ⎝ i=1 ⎠ Sau khi đã mô hình hóa được các đối tượng hình dạng, thực hiện tiếp quá trình mô hình hóa kết cấu hình ảnh của các đối tượng được quan tâm trong ảnh. Kết cấu hình ảnh của đối tượng được hiểu là các giá trị cường độ ảnh được giới hạn trong vùng ảnh được bao bởi đối tượng hình dạng tương ứng. Dữ liệu đối tượng hình dạng và kết cấu hình ảnh của đối tượng được quan tâm trong các mẫu có thể được biểu diễn dưới dạng các tham số. Vấn đề tiếp theo là thực hiện mô hình hóa tổng quát cho các dữ liệu này và tương tự phương pháp được lựa chọn là phân tích thành phần chính PCA. Giải thuật tìm kiếm tối ưu được sử dụng trong AAM được thiết kế cho phép tự động ước lượng các tham số mô hình cái mà có thể tổng hợp ra được ảnh mẫu gần nhất có thể với ảnh mục tiêu đầu vào nhằm mục đích cực tiểu sự sai lệch giữa ảnh mẫu đầu vào và ảnh tổng hợp được theo mô hình đã được lựa chọn. B. Mô hình chất liệu khuôn mặt Trong thực nghiệm, thuật toán AAM trích chọn các điểm điều khiển chính xác trong những trường hợp ảnh đầu vào có điều kiện đủ sáng và nền không quá phức tạp, trong trường hợp ánh sáng không đủ tại một số vùng của khuôn mặt hay nền gần giống với màu da thì thuật toán AAM thực hiện không hiệu quả. Do vậy, đề xuất này đưa ra một mô hình chất liệu mặt nhằm ràng buộc tập các điểm điều khiển trong không gian khuôn mặt kể cả khi điều kiện ánh sáng
398 Lê Thị Kim Nga, Phạm Trần Thiện, Hà Mạnh Toàn, Lâm Thành Hiển thay đổi và nền phức tạp. Chất liệu ảnh mặt có thể được mô hình hóa dựa vào bề mặt của chất liệu da và cấu trúc hình học của vùng mặt. Trong bài báo này, chất liệu khuôn mặt được quan tâm có một số tính chất như bao gồm chất liệu da cục bộ, đặc trưng thể hiện cho vùng da mặt của khuôn mặt trong ảnh, và phạm vi khuôn mặt được giới hạn tương đối trong một hình ellipse bao quanh vị trí khuôn mặt. Vấn đề đầu tiên ta quan tâm đến là việc xây dựng chất liệu da cục bộ và tách da. Da là một thành phần cấu tạo nên chất liệu mặt, do đó để xây dựng mô hình chất liệu mặt thì vấn đề quan trọng là phải xác định được các pixel là da và thực hiện phân cụm các pixel thành nhóm da và nhóm không da. Trong bước này ta sẽ phải duyệt qua các điểm trong ảnh vào. Tại mỗi điểm, ta sẽ phải xác định xem nó có phải là màu da hay không? Nếu là màu da, ta sẽ gán cho giá trị tại điểm đó bằng 1, nếu không ta sẽ gán giá trị 0. Kết quả ta có 1 ảnh nhị phân, với các điểm 1 (điểm trắng) là các điểm màu da. Trong nhiều nghiên cứu, các tác giả đã cố gắng xây dựng một mô hình chất liệu da tổng quát, ví dụ như C. Garcia, G. Zikos, G. Tziritas [2] đưa ra công thức được xây dựng trên hai hệ màu YCrCb và HSV hay K. Sandeep và A.N. Rajagopalan [16] xây dựng mô hình chất liệu da với histogram được tổng hợp trên một tập ảnh màu da (tập ảnh mẫu được chuẩn bị trước), nhưng không phải trên hệ màu RGB mà là trên hệ màu HSV và trên 2 thành phần H và S (histogram 2 chiều). Chúng tôi quan tâm đến việc xây dựng mô hình chất liệu da cục bộ, tức là công thức được tạo ra với riêng khuôn mặt đang quan tâm trong ảnh. Đây là cơ sở để có thể áp dụng được cho những trường hợp khuôn mặt được thu nhận trong những điều kiện chiếu sáng và chủng tộc khác nhau. Một cách tổng quát, mô hình chất liệu da là { } = ci ,ri ,i 1 n , trong đó ci ,ri tương ứng là tâm và bán kính của vùng giá trị trên trục tương ứng kênh màu i, n là tổng số kênh màu. Việc tách ngưỡng ở đây được thực hiện dựa trên ý tưởng của một hình ellipsoid trong không gian n chiều, các tham số của hình ellipsoid về tâm và bán kính trên các trục được sử dụng tương ứng với các tham số của mô hình chất liệu da. Một điểm không phải chất liệu da nếu nó nằm ngoài hình ellipsoid và là chất liệu da trong trường hợp ngược lại. Trên cơ sở ý tưởng đó, thuật toán tách ngưỡng ellipsoid được mô tả cụ thể như sau: Input: Ảnh I có giá trị màu n và chất liệu da Output: Ảnh mặt nạ M kết quả phân ngưỡng Các bước: = ()() Với mỗi điểm P p1 , p2 , , pn có tọa độ x, y là một điểm ảnh của I : d := 0; for i := 1 to n = + ()()− 2 d : d pi ci / ri ; if ()d ≤ 1 M ()x, y := 1; else M ()x, y := 0; Một vấn đề trọng tâm cần được giải quyết chính là việc xây dựng mô hình chất liệu da cục bộ. Nói cách khác, đó chính là vấn đề xây dựng thuật toán ước lượng các tham số cho mô hình chất liệu da. Việc ước lượng các tham số này được áp dụng với đầu vào là một ảnh khuôn mặt với ý tưởng là tìm một cụm các điểm ảnh gần nhau nhất và chiếm đa số các điểm ảnh của ảnh khuôn mặt. Do đầu vào là ảnh khuôn mặt nên kết quả của cụm này sẽ tương ứng với vùng ảnh da do nó chiếm đa số trong ảnh khuôn mặt. Giải thuật được thiết kế với quá trình lặp tương tự như ý tưởng trong thuật toán gom cụm k-means. Trên cơ sở ý tưởng đó, thuật toán ước lượng chất liệu da dựa trên tỉ lệ được mô tả cụ thể như sau: Input: Ảnh I kích thước w× h chiều và tỉ lệ r()0.5 < r < 1.0 Output: Chất liệu da Các bước: Khởi tạo C là màu trung bình của I
MỘT KỸ THUẬT ĐỊNH VỊ CÁC ĐIỂM ĐIỀU KHIỂN TRÊN KHUÔN MẶT DỰA TRÊN MÔ HÌNH CHẤT LIỆU 399 × L là mảng số thực có kích thước w h = ∗ ∗ m : r w h Repeat Với mỗi điểm ảnh của I(x, y) : ()∗ + = () () L y w x : dis tan ce C, I x, y Sắp xếp L tăng dần C := trung bình của m điểm ảnh tương ứng m giá trị đầu tiên trong L Until ( C không đổi) Dùng m điểm ảnh tương ứng m giá trị đầu tiên trong ảnh L , tính các giá trị ci và ri tương ứng Với mô hình các bước mô tả như trên, với một ảnh khuôn mặt đầu vào, ta có thể ước lượng được tham số cho mô hình chất liệu da mặt và sử dụng nó để tách ngưỡng lại ảnh ban đầu, kết quả ta sẽ thu được ảnh nhị phân thể hiện các vùng da. Thêm vào đó để có thể thực hiện tách vùng khuôn mặt, chúng tôi thực hiện ước lượng thêm một vùng ellipse quanh vị trí ban đầu. Như vậy, vùng giao sẽ là kết quả vùng tương ứng với vùng ảnh khuôn mặt đầu vào. Tuy nhiên do bản chất của việc tách ngưỡng với mô hình chất liệu da cục bộ ở bước trên, vùng khuôn mặt sẽ xuất hiện một số lỗ thủng tương ứng một số vị trí có chất liệu khác biệt với da như vùng mắt, miệng, lông mày. Do đó, cần thực hiện một thao tác lấp lỗ hổng để lấy được vùng mặt quan tâm. C. Thuật toán xác định vùng khuôn mặt Trên cơ sở mô hình chất liệu khuôn mặt đã được mô tả ở trên, chúng tôi đưa ra thuật toán xác định vị trí ảnh khuôn mặt trên ảnh tổng quát. Thuật toán thực hiện quá trình ước lượng chất liệu mặt và định vị với từng khuôn mặt trong ảnh. Trên cơ sở những kết quả đó, đầu ra của thuật toán là ảnh nhị phân đã được tổng hợp lại. Sau đây là sơ đồ của thuật toán xác định chính xác vùng mặt dựa trên mô hình chất liệu da đã xây dựng được: Input: Ảnh I Output: Ảnh mặt nạ M thể hiện vùng khuôn mặt Các bước: Khởi tạo Faces là danh sách các hình chứ nhật Các giá trị của M gán bằng 0 Phát hiện các khuôn mặt, lưu vào faces Với vị trí faces[i]: Chọn R là vùng ảnh mở rộng của faces[i] Khởi tạo ảnh I ' là ảnh n chiều tương ứng vùng R của I Tính chất liệu da bằng thuật toán ước lượng chất liệu da dựa trên tỉ lệ Tính mặt nạ M ' bằng thuật toán tách ngưỡng ellipsoid Ước lượng E là mặt nạ ellipse tương ứng của R M’ := M’ AND E Lấp các lỗ trong mặt nạ M ' Cập nhật M ' vào M III. THỬ NGHIỆM Chúng tôi tiến hành thử nghiệm thuật toán trên cơ sở dữ liệu ảnh mặt được thu thập bởi Markus Weber tại viện Công nghệ California, Hoa Kỳ. Cơ sở dữ liệu này bao gồm 450 ảnh khuôn mặt với kích thước 896 × 592 được thu thập dưới những điều kiện khác nhau về ánh sáng, biểu hiện khuôn mặt và nền khác nhau, trong đó có những ảnh với nhiều điều kiện ánh sáng phức tạp như ánh sáng ngoài trời hoặc chụp ngược sáng. Cơ sở dữ liệu này có thể được tải về từ địa chỉ Thuật toán đề xuất đã được thử nghiệm trên
400 Lê Thị Kim Nga, Phạm Trần Thiện, Hà Mạnh Toàn, Lâm Thành Hiển cơ sở dữ liệu này và thu được độ chính xác 287/450 ảnh, xấp xỉ 63,78%. Trong khi đó chúng tôi cũng thực nghiệm bộ dữ liệu này trên thuật toán AAM kết quả thấp hơn đó là 275/450, xấp xỉ 61,11% . Kết quả này chứng tỏ rằng kỹ thuật đề xuất hiệu quả hơn khi thực hiện trên AAM gốc. Hình 2 minh họa cho trường hợp thuật toán AAM có thể trích chọn tập điểm điều khiển không chính xác nhưng khi thực hiện trích chọn tập điểm điều khiển bằng thuật toán được đề xuất thì kết quả là khá chính xác. Thuật toán AAM Thuật toán đề xuất Hình 2. Một số kết quả trích chọn tập điểm điều khiển trong bộ ảnh của Markus Weber Ngoài ra chúng tôi còn ứng dụng nó với vai trò là một module trích rút biểu cảm khuôn mặt cho chương trình nhận dạng biểu cảm mặt được phát triển tại Đại học Quy Nhơn với dữ liệu chúng tôi tự thu thập được tại trường Đại học Quy Nhơn. Tập dữ liệu được thu thập trong nhiều hoàn cảnh khác nhau về ánh sáng và nền. Với cơ sở dữ liệu thu nhận tại Trường Đại học Quy Nhơn, độ chinh xác khi thực hiện trên thuật toán AAM là 597/758 đạt 76,78% và khi thực hiện trên thuật toán đề xuất thì độ chính xác là 625/758 đạt 82,45%. Hình 3 cho thấy kết quả thực hiện trên thuật toán đề xuất với dữ liệu thu nhận được tại Trường Đại học Quy Nhơn khá hiệu quả, đặc biệt trong trường hợp màu da trùng với màu nền. Thuật toán AAM Thuật toán đề xuất Hình 3. Một số kết quả trích chọn tập điểm điều khiển trong CSDL ảnh khuôn mặt tại Đại học Quy Nhơn
MỘT KỸ THUẬT ĐỊNH VỊ CÁC ĐIỂM ĐIỀU KHIỂN TRÊN KHUÔN MẶT DỰA TRÊN MÔ HÌNH CHẤT LIỆU 401 Chương trình thử nghiệm được chúng tôi phát triển sử dụng ngôn ngữ C++, môi trường phát triển Visual Studio 2008 với sự hỗ trợ của thư viện mã nguồn mở OpenCV. Trong quá trình thực hiện thử nghiệm, chúng tôi đã cấu hình một số tham số sử dụng trong chương trình như sau: tham số tỉ lệ r cho gom cụm là 0.85, tham số ước lượng hình ellipse được ước lượng dựa trên kinh nghiệm. Ảnh hưởng của điều kiện chiếu sáng và nền gây ra nhiễu và sai lệch nhiều cho việc trích chọn các điểm điều khiển trên khuôn mặt. Kết quả thử nghiệm cho thấy thuật toán đề xuất thực hiện hiệu quả hơn khi thực hiện việc trích chọn các điểm điều khiển trên khuôn mặt với thuật toán AAM. IV. KẾT LUẬN Định vị chính xác tập các điểm điều khiển trên khuôn mặt là một trong những vấn đề quan trọng của thị giác máy. Thuật toán AAM là một một toán trích chọn điểm điều khiển trên khuôn mặt hiệu quả nhất khi dữ liệu thu nhận được trong những điều kiện ánh sáng tốt, trong điều kiện ánh sáng và nền phức tạp thì thuật toán AAM không hiệu quả. Do đó, bài báo đề xuất một kỹ thuật định vị điểm điều khiển có ràng buộc dựa trên mô hình chất liệu mặt. Thực nghiệm được cài đặt trên cơ sở dữ liệu Markus Weber và ứng dụng cho việc trích rút đặc trưng nhận dạng biểu cảm khuôn mặt trong được phát triển cho cơ sở dữ liệu ở Trường Đại học Quy Nhơn. Kết quả thử nghiệm cho thấy kỹ thuật đề xuất dựa trên tiếp cận chất liệu cho kết quả chính xác cao hơn thuật toán AAM, đặc biệt là trong trường hợp màu da khác nhau, ánh sáng thay đổi thì tiếp cận dựa trên chất liệu tỏ ra rất hiệu quả. V. TÀI LIỆU THAM KHẢO [1] Jing Xiao, Simon Baker, Iain Matthews, Takeo Kanade (2004), “Real-Time Combined 2D+3D Active Appearance Models” Proceedings of the IEEE Conference on Computer Vision and Pattern Recognition, pp. 535 – 542. [2] Garcia, C. and G. Tziritas. "Face detection using quantized skin color regions merging and wavelet packet analysis." IEEE Trans. Multimedia, 1999. pp. 264 - 277. [3] Timothy F. Cootes, et al. (2001). "Active Appearance Models" IEEE TRANSACTIONS ON PATTERN ANALYSIS AND MACHINE INTELLIGENCE 23. P. Viola, M. Jones (2001), “Rapid object detection using a boosted cascade of simple features”, Proc. IEEE Conf. Computer Vision and Pattern Recognition (CVPR’01), pp. 511-518. [4] A. Rajagopalan, K. Kumar, J. Karlekar, R. Manivasakan, M. Patil, U. Desai, P. Poonacha, S. Chaudhuri (1998), “Finding Faces in Photographs”, Proc. 6th IEEE Conf. Computer Vision (ICCV’98), pp. 640-645. [5] G. Yang, T. S. Huang (1994), “Human Face Detection in Complex Background”, Pattern Recognition Vol. 27(1), pp. 53-63. [6] K. C. Yow, R. Cipolla (1997), “Feature-Based Human Face Detection”, Image and Vision Computing Vol. 15 (9), pp. 713-735. [7] C. Kotropoulos (1997), I. Pitas, “Rule-based Face Detection in Frontal Views”, Proc. Int’l Conf.Acoustics, Speech and Signal Processing Vol. 4, pp. 2637-2540. [8] A. Lanitis, C. J. Taylor, T. F. Cootes (1995), “An Automatic Face Identification System Using Flexible Appearance Models”, Image and Vision Computing Vol. 13(5), pp. 393-401. [9] M. Turk, A. Pentland (1991), “Eigenfaces for Recognition”, Journal of Cognitive Neuroscience Vol. 3(1), pp. 71-86. [10] I. Craw, D. Tock, A. Bennett (1992), “Finding Face Features”, Proc. 2nd European Conf. Computer Vision (ECCV’92) Vol. 2, pp. 92-96. [11] Sharan B.L., Rosenholtz R., Adelson E.H. (2009). “Material perception: What can you see in a brief glance?”, Journal of Vision Vol. 9 (8), pp. 784-794. [12] Sharan B.L., Liu C., Rosenholtz R., Adelson E.H. (2013), “Recognizing Materials Using Perceptually Inspired Features”, International Journal of Computer Vision Vol. 103, pp. 348-371. [13] Henry K.M., Ponce J. (2006), “A Geodesic Active Contour Framework for Finding Glass”, Proceeding of the IEEE Computer Society Conference on Computer Vision and Pattern Recognition, pp. 1-8. [14] Thomas A., Ferrari V., Leibe B., Tuytelaars A.T., (2006), “Towards Multi-View Object Class Detection”, In Proceedings of the IEEE Computer Society Conference on Computer Vision and Pattern Recognition, pp. 1-8. [15] Lam Thanh Hien, Tran Van Lang, Ha Manh Toan, Do Nang Toan (2012), Modeling the Human Face and its Application for Detection of Driver Drowsiness, International Journal of Computer Science and Telecommunications, ISSN 2047-3338, Vol.3, Issue 11, 2012, pp.56-59. [16] Lê Hoàng Thái, Lê Minh Trí, Nguyễn Thúy Hằng (2007) “Đề xuất phương pháp trích chọn đặc trưng mới cho bài toán nhận dạng mặt người”, Kỷ yếu Hội thảo Quốc gia “Một số vấn đề chọn lọc của Công nghệ thông tin và Truyền thông”, Đà Lạt 15-17/6/2006, tr. 2-5.
402 Lê Thị Kim Nga, Phạm Trần Thiện, Hà Mạnh Toàn, Lâm Thành Hiển [17] Vũ Thanh Hưng, Ngô Đức Thành Nguyễn Ngọc Thảo, Lê Đình Duy, Shi’ichi Statoh, Lê Hoài Bắc, Dương Anh Đức (2011) “So khớp chuỗi ảnh mặt người trên dữ liệu video lớn”, Kỷ yếu Hội thảo Quốc gia “Nghiên cứu cơ bản và ứng dụng Công nghệ thông tin”, Biên Hòa 11-12/8/2011, tr. 217-226. [18] Lê Thị Kim Nga, Đỗ Năng Toàn (2010), “Một cách tiếp cận cho phát hiện chất liệu ảnh”, Kỷ yếu Hội thảo Quốc gia: Các vấn đề chọn lọc của Công nghệ Thông tin và Truyền Thông, tr. 202-213. [19] Do Nang Toan, Le Thi Kim Nga (2011), “Material Detection Based on Fractal Approach”, ACM Proceedings of the 9th International Conference on Advances in Mobile Computing &Multimedia (MoMM2011), pp. 281-284. A METHOD FOR EXTRACTING FACE CONTROL POINTS BASED ON MATERIAL MODELS 1 2 3 4 Le Thi Kim Nga , Pham Tran Thien , Ha Manh Toan , Lam Thanh Hien 1 Faculty of Information Technology, Quy Nhon University 2 Organization and staff, Quy Nhon University 3Institute of Information Technology, Vietnam Academy of Science and Technology 4Lac Hong University kimnga78@gmail.com,,phamtranthien@qnu.edu.vn, lthien70@yahoo.com ABSTRACT - One important step in facial expressions recognition is positioning the control point represents the state faces accurately . This article refers to the construction of the binding location for the control point based facila material models with adaptively. Because of this constraint, the control point will be positioned precisely and faster during later detection. Techniques have been installed tested and proved to be effective in facial expressions recognition, even in low-light conditions and complex background.