Đồ án Tìm hiểu giải thuật di truyền ứng dụng giải bài toán lập lịch - Đỗ Văn Chiếu

pdf 41 trang huongle 2960
Bạn đang xem 20 trang mẫu của tài liệu "Đồ án Tìm hiểu giải thuật di truyền ứng dụng giải bài toán lập lịch - Đỗ Văn Chiếu", để tải tài liệu gốc về máy bạn click vào nút DOWNLOAD ở trên

Tài liệu đính kèm:

  • pdfdo_an_tim_hieu_giai_thuat_di_truyen_ung_dung_giai_bai_toan_l.pdf

Nội dung text: Đồ án Tìm hiểu giải thuật di truyền ứng dụng giải bài toán lập lịch - Đỗ Văn Chiếu

  1. TÌM HIỂU GIẢI THUẬT DI TRUYỀN ÁP DỤNG GIẢI BÀI TOÁN LẬP LICH BỘ GIÁO DỤC VÀ ĐÀO TẠO TRƢỜNG ĐẠI HỌC DÂN LẬP HẢI PHÕNG iso 9001 : 2008 BÁO CÁO TỐT NGHIỆP NGÀNH: CÔNG NGHỆ THÔNG TIN Địa điểm thực tập: Trƣờng Đại học Dân lập Hải Phòng Đề tài: Tìm Hiểu Giải Thuật Di Truyền Ứng Dụng Giải Bài Toán Lập Lịch Giáo viên hƣớng dẫn: Th.S Đỗ Văn Chiểu Sinh viên :Hoàng Chính Nghĩa Mã số: 090036 Lớp : CT901 Khoá:9 Hải Phòng,3/2009 Báo Cáo Đồ Án Tốt Nghiệp _Hoàng Chính Nghĩa _Ct901 1
  2. TÌM HIỂU GIẢI THUẬT DI TRUYỀN ÁP DỤNG GIẢI BÀI TOÁN LẬP LICH LỜI CẢM ƠN Để hoàn thành bài báo cáo thực tập này, trƣớc hết, em xin cảm ơn các thầy giáo, cô giáo Khoa Công nghệ thông tin Trƣờng Đại học Dân lập Hải Phòng, những ngƣời đã dạy dỗ, trang bị cho em những kiến thức chuyên môn trong bốn năm học,và giúp chúng em hiểu rõ hơn các lĩnh vực đã nghiên cứu để hoàn thành đề tài đƣợc giao. Em xin bày tỏ lòng biết ơn xâu sắc nhất tới thầy giáo Thạc sĩ Đỗ Văn Chiểu, ngƣời đã hƣớng dẫn, chỉ bảo tận tình để em hoàn thành quá trình thực tập. Xin cảm ơn bạn bè và gia đình đã động viên cổ vũ, đóng góp ý kiến, trao đổi, động viên trong suốt quá trình học cũng nhƣ làm tốt nghiệp, giúp em hoàn thành đề tài đúng thời hạn. Em xin chân thành cảm ơn ! Hải Phòng, tháng 6 năm 2009 Sinh viên Hoàng Chính Nghĩa Báo Cáo Đồ Án Tốt Nghiệp _Hoàng Chính Nghĩa _Ct901 2
  3. TÌM HIỂU GIẢI THUẬT DI TRUYỀN ÁP DỤNG GIẢI BÀI TOÁN LẬP LICH MUC LUC LỜI MỞ ĐẦU 4 CHƢƠNG I- TÌM HIỂU VỀ BÀI TOÁN LẬP LỊCH 5 1.1 Tìm hiểu chung 5 1.2 Các đặc tính của bài toán lập lịch 6 1.3 Bài Toán Lập Lịch Thời Khoá Biểu 6 1.3.1 Giới thiệu bài toán 6 1.3.2 Dữ liệu bài toán 6 1.4 Một số bƣớc cơ bản để giải quyết bài toán lập lịch thời khoá biếu 7 CHƢƠNG II-GIẢI THUẬT DI TRUYỀN (GAs) 8 2.1 Tìm hiểu chung về Gas 8 2.2. Các toán tử của giải thuật di truyền 12 2.3 Các tham số của giải thuật di truyền. 13 2.4. Công thức của Giải thuật Di Truyền 14 2.5. Các thành phần của thuật giải di truyền 15 2.5.1 Khởi động quần thể ban đầu 15 2.5.2 Đánh giá cá thể 15 2.5.3 Toán tử lai ghép 16 2.5.4 Toán tử đột biến 16 2.5.5 Điều kiện kết thúc 17 CHƢƠNG III- ỨNG DỤNG GIẢI THUẬT DI TRUYỀN VÀO BÀI TOÁN XẾP LỊCH THỜI KHOÁ BIỂU 17 3.1 Giai đoạn 1 - xếp lịch học các lớp 18 3.1.1 Chọn mô hình cá thể 18 3.1.2 Tạo quần thể ban đầu 21 3.1.3 Độ thích nghi - chọn cá thể 22 3.1.4 Thuật toán lai ghép và đột biến 23 3.2 Giai đoạn 2 - xếp lịch học cho toàn bộ cơ sở 23 3.2.1 Chọn mô hình cá thể 23 3.2.2 Tạo quần thể ban đầu 25 3.2.3 Độ thích nghi - chọn cá thể 25 3.2.4 Thuật toán lai ghép và đột biến 26 3.2.5 Chọn điểm dừng thuật toán 26 CHƢƠNG 4- THIẾT KẾ HỆ THỐNG LẬP LỊCH THỜI KHÓA BIỂU 27 4.1 Thiết kế cơ sở dữ liệu bài toán 27 4.2 Các đối tƣợng của lịch học 28 4.3 Biểu diễn nhiễm sắc thể 28 4.4 Các tham số của giải thuật di truyền 30 4.4.1 Phép lai ghép 30 4.4.2 Phép đột biến 33 4.6 Độ thích nghi 34 4.7 Chƣơng trình thực nghiệm 37 Kết luận và hƣớng phát triển 40 Tài Liệu Tham Khảo 41 Báo Cáo Đồ Án Tốt Nghiệp _Hoàng Chính Nghĩa _Ct901 3
  4. TÌM HIỂU GIẢI THUẬT DI TRUYỀN ÁP DỤNG GIẢI BÀI TOÁN LẬP LICH LỜI MỞ ĐẦU Trong ngành khoa học máy tính, tìm kiếm lời giải tối ƣu cho các bài toán là vấn đề đƣợc các nhà khoa học máy tính đặc biệt rất quan tâm. Mục đích chính của các thuật toán tìm kiếm lời giải là tìm ra lời giải tối ƣu nhất cho bài toán trong thời gian nhỏ nhất. Các thuật toán nhƣ tìm kiếm không có thông tin / vét cạn ( tìm kiếm trên danh sách, trên cây hoặc đồ thị ) sử dụng phƣơng pháp đơn giản nhất và trực quan nhất hoặc các thuật toán tìm kiếm có thông tin sử dụng heurictics để áp dụng các tri thức về cấu trúc của không gian tìm kiếm nhằm giảm thời gian cần thiết cho việc tìm kiếm đƣợc sử dụng nhiều nhƣng chỉ với không gian tìm kiếm nhỏ và không hiệu quả khi tìm kiếm trong không gian tìm kiếm lớn. Tuy nhiên, trong thực tiễn có rất nhiều bài toán tối ƣu với không gian tìm kiếm rất lớn cần phải giải quyết. Vì vậy, việc đòi hỏi thuật giải chất lƣợng cao và sử dụng kỹ thuật trí tuệ nhân tạo đặc biệt rất cần thiết khi giải quyết các bài toán có không gian tìm kiếm lớn. Thuật giải di truyền (genetic algorithm) là một trong những kỹ thuật tìm kiếm lời giải tối ƣu đã đáp ứng đƣợc yêu cầu của nhiều bài toán và ứng dụng. Thuật giải di truyền đã đƣợc phát minh ra để bắt chƣớc quá trình phát triển tự nhiên trong điều kiện quy định sẵn của môi trƣờng. Các đặc điểm của quá trình này đã thu hút sự chú ý của John Holand (ở đại học Michigan) ngay từ những năm 1970. Holand tin rằng sự gắn kết thích hợp trong thuật giải máy tính có thể tạo ra một kỹ thuật giúp giải quyết các vấn đề khó khăn giống nhƣ trong tự nhiên đã diễn ra-thông qua quá trình tiến hóa. Trên thế giới hiện nay, Thuật Giải Di Truyền kết hợp với Công nghệ thông tin đƣợc ứng dụng để giải quyết những vấn đề phức tạp trong hệ thống điện một Báo Cáo Đồ Án Tốt Nghiệp _Hoàng Chính Nghĩa _Ct901 4
  5. TÌM HIỂU GIẢI THUẬT DI TRUYỀN ÁP DỤNG GIẢI BÀI TOÁN LẬP LICH cách rất hiệu quả. Nhƣng trong đề tài này, chúng ta nghiên cứu ứng dụng Thuật Giải Di Truyền xếp Thời khoá biểu trong trƣờng Đại học. Nội dung báo cáo gồm lời nói đầu và bốn chƣơng chính: Chƣơng 1- Tìm hiểu về bài toán lập lịch Chƣơng 2- Giải thuật di truyền Chƣơng 3- Ứng dụng giải thuật Di truyền vào bài toán sắp xếp thời khoá biểu Chƣơng 4- Thiếp kế hệ thống lập lich thời khoá biểu CHƢƠNG I- TÌM HIỂU VỀ BÀI TOÁN LẬP LỊCH (Scheduling problem) 1.1 Tìm hiểu chung Lập lịch có thể đƣợc định nghĩa là một bài toán tìm kiếm chuỗi tối ƣu để thực hiện một tập các hoạt động chịu tác động của một tập các ràng buộc cần phải đƣợc thỏa mãn. Ngƣời lập lịch thƣờng cố gắng thử đến mức tối đa sự sử dụng các cá thể, máy móc và tối thiểu thời gian đòi hỏi để hoàn thành toàn bộ quá trình nhằm sắp xếp lịch.Vì thế bài toán lập lịch là một vấn đề rất khó để giải quyết . Hiện nay có nhiều khả năng để phát triển các kỹ thuật hiện tại để giải quyết bài toán này. Những kỹ thuật đó bao gồm: các tiếp cận Trí tuệ nhân tạo nhƣ hệ thống tri thức cơ sở (knowledge-based systems), bài toán thoả mãn ràng buộc, hệ chuyên gia, mạng Nơron và các tiếp cận của các Nghiên cứu hoạt động: lập trình tính toán, lập trình động, tìm kiếm nhánh và đƣờng biên, kỹ thuật mô phỏng, tìm kiếm Tabu và phƣơng pháp nút cổ chai Báo Cáo Đồ Án Tốt Nghiệp _Hoàng Chính Nghĩa _Ct901 5
  6. TÌM HIỂU GIẢI THUẬT DI TRUYỀN ÁP DỤNG GIẢI BÀI TOÁN LẬP LICH 1.2 Các đặc tính của bài toán lập lịch Tài nguyên: đó là các nguồn dữ liệu đầu vào của bài toán. Các tài nguyên này có thể phục hồi hoặc không. Tác vụ: đƣợc đánh giá qua các tiêu chuẩn thực hiện nhƣ thời gian thực hiện, chi phí, mức tiêu thụ nguồn tài nguyên. Ràng buộc: đây là những điều kiện cần thỏa mãn để bài toán có thể đƣa ra lời giải tốt nhất Mục tiêu: đánh giá độ tối ƣu của lịch trình lời giải của bài toán. Khi các mục tiêu đƣợc thỏa mãn thì các ràng buộc cũng phải đƣợc thỏa mãn 1.3 Bài Toán Lập Lịch Thời Khoá Biểu 1.3.1 Giới thiệu bài toán Bài toán đặt ra vấn đề cần sắp xếp thời khoá biếu cho một trƣờng đại học với nhiều cơ sở khác nhau. Cần có sự sắp xếp lịch học cho các lớp tại các phòng ở mỗi địa điểm, sao cho vừa phù hợp lại vừa tiện dụng nhất 1.3.2 Dữ liệu bài toán . Danh sách cơ sở . Danh sách khoa . Danh sách khoá học . Danh sách học phần học và các lớp trong học kỳ . Danh sách lớp học . Danh sách giáo viên . Danh sách phòng học Báo Cáo Đồ Án Tốt Nghiệp _Hoàng Chính Nghĩa _Ct901 6
  7. TÌM HIỂU GIẢI THUẬT DI TRUYỀN ÁP DỤNG GIẢI BÀI TOÁN LẬP LICH . Danh sách môn học và số tiết . Bảng phân công giáo viên giảng dạy tại các lớp . Bảng yêu cầu ràng buộc của giáo viên vớI lịch dạy . Bảng yêu cầu ràng buộc của lớp với lịch học . Bảng yêu cầu ràng buộc của phòng với lịch sử dụng phòng đó 1.4 Một số bƣớc cơ bản để giải quyết bài toán lập lịch thời khoá biếu Bƣớc 1. Khởi tạo dữ liệu thời khóa biểu mới Bƣớc 2. Nhập, điều chỉnh dữ liệu gốc thời khóa biểu Bƣớc 3. Nhập, sửa, điều chỉnh các ràng buộc chính của thời khóa biểu Các ràng buộc chính của thời khóa biểu là nhóm các dữ liệu có nhiệm vụ định hình và khuôn dạng của thời khóa biểu. Đây là nhóm các lệnh rất quan trọng của bài toán và phần mềm thời khóa biểu. Bƣớc 4. Nhập bảng Phân công giảng dạy (PCGD) Bảng phân công giảng dạy (hay còn gọi là Phân công chuyên môn) là phần dữ liệu quan trọng nhất và phức tạp nhất của mọi thời khóa biểu. Bảng này chỉ ra các phân công cụ thể của thời khóa biểu: giáo viên nào dạy lớp nào, môn học nào và một tuần dạy bao nhiêu tiết Bƣớc 5. Chuẩn bị xếp thời khóa biểu Bƣớc 6. Xếp tự động TKB Bƣớc 7. Điều chỉnh, tinh chỉnh dữ liệu thời khóa biểu Báo Cáo Đồ Án Tốt Nghiệp _Hoàng Chính Nghĩa _Ct901 7
  8. TÌM HIỂU GIẢI THUẬT DI TRUYỀN ÁP DỤNG GIẢI BÀI TOÁN LẬP LICH Bƣớc 8. Hoàn thiện thời khóa biểu (sử dụng RAD) Bƣớc 9. In ấn TKB Bƣớc 10. Tổng hợp, thống kê và truy vấn thông tin thời khóa biểu CHƢƠNG II-GIẢI THUẬT DI TRUYỀN (GAs) 2.1 Tìm hiểu chung về Gas Genetic algorithms (thuật giải di truyền) là một giải thuật mô phỏng theo quá trình chọn lọc tự nhiên, là kỹ thuật chung giúp giải quyết vấn đề bài toán bằng cách mô phỏng sự tiến hóa của con ngƣời hay của sinh vật nói chung (dựa trên thuyết tiến hóa muôn loài của Darwin) trong điều kiện qui định sẵn của môi trƣờng. Lấy ý tƣởng từ quá trình tiến hoá tự nhiên, xuất phát từ một lớp các lời giải tiềm năng ban đầu, GA tiến hành tìm kiếm trên không gian lời giải bằng cách xây dựng lớp lời giải mới tốt hơn (tối ƣu hơn) lời giải cũ. Quá trình xây dựng lớp lời giải mới đƣợc tiến hành dựa trên việc chọn lọc, lai ghép, đột biến từ lớp lời giải ban đầu. Quần thể lời giải trải qua quá trình tiến hoá: ở mỗi thế hệ lại tái sinh các lời giải tƣơng đối tốt, trong khi các lời giải “xấu” thì chết đi. Vậy GAs làm gì? Trong GA, một tập các biến của bài toán đƣa ra đƣợc mã hóa sang một chuỗi (hay một cấu trúc mã hóa khác) tƣơng tự nhƣ một nhiễm sắc thể trong tự nhiên. Mỗi chuỗi bao gồm một giải pháp có thể của bài toán. Giải thuật di truyền sử dụng các toán tử đƣợc sinh ra bởi sự chọc lọc tự nhiên một quần thể các chuỗi nhị phân (hoặc các cấu trúc khác), mã hóa khoảng tham số trên mỗi thế hệ, khảo sát các phạm vi khác nhau của không gian tham số, và định hƣớng tìm kiếm đối Báo Cáo Đồ Án Tốt Nghiệp _Hoàng Chính Nghĩa _Ct901 8
  9. TÌM HIỂU GIẢI THUẬT DI TRUYỀN ÁP DỤNG GIẢI BÀI TOÁN LẬP LICH với khoảng mà là xác suất cao để tìm kiếm sự thực hiện tốt hơn. Thuật toán di truyền gồm có bốn quy luật cơ bản là lai ghép, đột biến, sinh sản và chọn lọc tự nhiên Quá trình lai ghép (phép lai) quá trình này diễn ra bằng cách ghép một hay nhiều đoạn gen từ hai nhiễm sắc thể cha-mẹ để hình thành nhiễm sắc thể mới mang đặc tính của cả cha lẫn mẹ. Phép lai này có thể mô tả nhƣ sau: -Chọn ngẫu nhiên hai hay nhiều cá thể trong quần thể. Giả sử chuỗi nhiễm sắc thể của cha và mẹ đều có chiều dài là m. Tìm điểm lai bằng cách tạo ngẫu nhiên một con số từ 1 đến m-1. Nhƣ vậy, điểm lai này sẽ chia hai chuỗi nhiễm sắc thể cha-mẹ thành hai nhóm nhiễm sắc thể con là m1 và m2. Hai chuỗi nhiễm sắc thể con lúc này sẽ là m11+m22 và m21+m12. Đƣa hai chuỗi nhiễm sắc thể con vào quần thể để tiếp tục tham gia quá trình tiến hóa Quá trình đột biến (phép đột biến) quá trình tiến hóa đƣợc gọi là quá trình đột biến khi một hoặc một số tính trạng của con không đƣợc thừa hƣởng từ hai chuỗi nhiễm sắc thể cha-mẹ. Phép đột biến xảy ra với xác suất thấp hơn rất nhiều lần so với xác suất xảy ra phép lai. Phép đột biến có thể mô tả nhƣ sau: -Chọn ngẫu nhiên một số k từ khoảng 1 ≥ k ≥ m -Thay đổi giá trị của gen thứ k -Đƣa nhiễm sắc thể con vào quần thể để tham gia quá trình tiến hóa tiếp theo Quá trình sinh sản và chọn lọc (phép tái sinh và phép chọn) Báo Cáo Đồ Án Tốt Nghiệp _Hoàng Chính Nghĩa _Ct901 9
  10. TÌM HIỂU GIẢI THUẬT DI TRUYỀN ÁP DỤNG GIẢI BÀI TOÁN LẬP LICH Phép tái sinh: là quá trình các cá thể đƣợc sao chép dựa trên độ thích nghi của nó. Độ thích nghi là một hàm đƣợc gán các giá trị thực cho các cá thể trong quần thể của nó. Phép tái sinh có thể mô phỏng nhƣ sau: -Tính độ thích nghi của từng cá thể trong quần thể, lập bảng cộng dồn các giá trị thích nghi đó (theo thứ tự gán cho từng cá thể) ta đƣợc tổng độ thích nghi. Giả sử quần thể có n cá thể. Gọi độ thích nghi của cá thể thứ i là Fi, tổng dồn thứ i là Ft. Tổng độ thích nghi là Fm Tạo số ngẫu nhiên F có giá trị trong đoạn từ 0 đến Fm -Chọn cá thể k đầu tiên thỏa mãn F ≥ Ft đƣa vào quần thể của thế hệ mới. Phép chọn: là quá trình loại bỏ các cá thể xấu và để lại những cá thể tốt. Phép chọn đƣợc mô tả nhƣ sau: - Sắp xếp quần thể theo thứ tự độ thích nghi giảm dần - Loại bỏ các cá thể cuối dãy, chỉ để lại n cá thể tốt nhất. Báo Cáo Đồ Án Tốt Nghiệp _Hoàng Chính Nghĩa _Ct901 10
  11. TÌM HIỂU GIẢI THUẬT DI TRUYỀN ÁP DỤNG GIẢI BÀI TOÁN LẬP LICH Cấu trúc thuật giải di truyền tổng quát Bắt Đầu Bắt đầu t =0; Khởi tạo P(t) Khởi tạo quần thể Tính độ thích nghi cho các cá thể thuộc P(t); Khi (điều kiện dừng chƣa thỏa) lặp t = t + 1; Chọn lọc P(t) Mã hoá các biến Lai P(t) Đột biến P(t) Đánh giá độ thích nghi Hết lặp Kết thúc Chọn lọc Lai ghép Đột biến Không Thoả điều kiện dừng Thoả Kết quả Kết thúc Báo Cáo Đồ Án Tốt Nghiệp _Hoàng Chính Nghĩa _Ct901 11
  12. TÌM HIỂU GIẢI THUẬT DI TRUYỀN ÁP DỤNG GIẢI BÀI TOÁN LẬP LICH Sau đây là những nguyên tắc cơ bản thực hiện giải thuật di truyền GAs: B1: Khởi tạo và mã hóa một quần thể ngẫu nhiên của NST. Đó gọi là “quần thể hiện tại” B2: Đánh giá độ thích nghi của mỗi NST trong quần thể hiện tại. B3: Tạo ra thế hệ trung gian, thông qua chọn lựa suy diễn các NST trong quần thể hiện tại tuỳ theo độ thích nghi. Đó sẽ là cha mẹ của những thế hệ tiếp theo. B4: Áp dụng toán tử lai ghép và nghịch đảo đối với những cặp hoặc NST đơn trong thế hệ trung gian, qua đó sẽ sản sinh ra một thế hệ NST mới. Đó là quần thể hiện tại. Lặp lại các bƣớc 2-4 cho đến khi một giải pháp phù hợp đƣợc tìm thấy. 2.2. Các toán tử của giải thuật di truyền + Toán tử chọn lọc o Chọn lọc dựa trên độ thích nghi. o Chọn lọc dựa trên sự xếp hạng o Chọn lọc dựa trên sự cạnh tranh o Chọn lọc hƣớng không gian + Toán tử di cƣ + Toán tử nghịch đảo Báo Cáo Đồ Án Tốt Nghiệp _Hoàng Chính Nghĩa _Ct901 12
  13. TÌM HIỂU GIẢI THUẬT DI TRUYỀN ÁP DỤNG GIẢI BÀI TOÁN LẬP LICH + Toán tử đột biến + Toán tử lai ghép o Lai ghép một điểm (one-point crossover) o Lai ghép hai điểm (two-point crossover) o Lai ghép N điểm (N-point crossover) o Lai ghép đồng nhất (Uniform crossover) 2.3 Các tham số của giải thuật di truyền. Xác suất lai ghép: là tham số cho biết tần suất thực hiện toán tử lai ghép. Nếu không có lai ghép, cá thể con sẽ chính là bản sao của cá thể “cha mẹ”. Nếu xác suất lai ghép bằng 100%, khi đó mọi cá thể con đều đƣợc tạo ra qua quá trình lai ghép. Xác suất đột biến: là tham số cho biết tần suất đột biến của nhiễm sắc thể. Nếu không có đột biến, thế hệ con đƣợc tạo ra ngay sau giai đoạn lai ghép mà không bị thay đổi. Ngƣợc lại, một hoặc một số phần của nhiễm sắc thể sẽ bị thay đổi. Nếu xác suất đột biến là 100%, toàn bộ nhiễm sắc thể sẽ bị thay đổi. Nếu tham số này bằng 0%, không có gì bị thay đổi hết Kích thƣớc quần thể: là tham số cho biết có bao nhiêu cá thể (NST) trong 1 thế hệ của quần thể. Nếu có quá ít cá thể, khả năng thực hiện lai ghép rất nhỏ và khi đó chỉ có một vùng tìm kiếm nhỏ mới đƣợc khảo sát. Ngƣợc lại, việc kích thƣớc quần thể quá lớn cũng không tốt, do nó sẽ làm chậm quá trình giải bài toán. Báo Cáo Đồ Án Tốt Nghiệp _Hoàng Chính Nghĩa _Ct901 13
  14. TÌM HIỂU GIẢI THUẬT DI TRUYỀN ÁP DỤNG GIẢI BÀI TOÁN LẬP LICH 2.4. Công thức của Giải thuật Di Truyền Tính độ thích nghi eval(vi) của mỗI nhiễm sắc thể vi(i=1 kích thƣớc quần thể) với f(vi) là hàm mục tiêu Tìm tổng giá trị thích nghi của quần thể Tính xác xuất chọn Pi cho mỗI nhiễm sắc thể vi Tính xác suất tích luỹ pi cho mỗi nhiễm sắc thể Pi Tiến trình chọn lọc đƣợc thực hiện bằng cách quay bánh xe rulet kích thƣớc quần thể lần. Mỗi lần chọn ra một nhiễm sắc thể từ quần thể hiện hành vào quần thể mới theo cách sau: Báo Cáo Đồ Án Tốt Nghiệp _Hoàng Chính Nghĩa _Ct901 14
  15. TÌM HIỂU GIẢI THUẬT DI TRUYỀN ÁP DỤNG GIẢI BÀI TOÁN LẬP LICH Phát sinh một số ngẫu nhiên r trong khoảng [0, 1] Nếu r < q1thì chọn nhiễm sắc thể v1, ngƣợc lại chọn nhiễm sắc thể vi (2 ≤ i ≤ kích thƣớc quần thể) sao cho qi-1 < r ≤ qi 2.5. Các thành phần của thuật giải di truyền 2.5.1 Khởi động quần thể ban đầu Tạo quần thể đầu tiên trong thuật giải, là nơi xuất phát quá trình tiến hóa, bao gồm tất cả các giá trị thô ban đầu. Tùy theo vấn đề của bài toán mà có cách khởi động khác nhau. Trƣớc một bài toán áp dụng thuật giải di truyền, ta cần phải xác định rõ nhiễm sắc thể và cá thể cho vấn đề, và thông thƣờng đó sẽ kết quả cuối cùng. Việc phân tích sẽ dựa trên kết quả là cơ bản nhất. 2.5.2 Đánh giá cá thể Chắc chắn rằng việc chọn cá thể sẽ thông qua kết quả, hay mục đích của vấn đề. Dựa trên mức độ thích nghi của cá thể, bao gồm những vƣớng mắc mà cá thể gặp phải. Thông thƣờng, đặt mỗi vấn đề nhỏ tƣơng ứng với một giá trị điểm thích nghi, kết quả đánh giá gồm tổng các số điểm đó. Cá thể tốt nhất sẽ có số điểm thấp nhất hoặc lớn nhất. Theo thuyết tiến hóa của Darwin, nhiễm sắc thể tốt nhất sẽ tồn tại và tạo ra các cá thể con mới. Có nhiều phƣơng pháp để chọn các nhiễm sắc thể tốt nhất. 1) Chọn lọc Roulette (Roulette Wheel Selection) 2) Chọn lọc xếp hạng (Rank Selection) 3) Chọn lọc cạnh tranh (Tournament Selection) Báo Cáo Đồ Án Tốt Nghiệp _Hoàng Chính Nghĩa _Ct901 15
  16. TÌM HIỂU GIẢI THUẬT DI TRUYỀN ÁP DỤNG GIẢI BÀI TOÁN LẬP LICH 2.5.3 Toán tử lai ghép Lai ghép nhằm nâng cao kết quả cá thể, do đó, toán tử lai ghép sẽ tạo điều kiện cho tiến trình hội tụ nhanh hay chậm. Còn tùy thuộc vào cách tổ chức và phân bố các nhiễm sắc thể mà chúng ta có xác suất lai ghép nhanh hay chậm. Sau đây là vài phƣơng pháp lai ghép thông dụng trong kỹ thuật di truyền: 1) Lai ghép ánh xạ từng phần (PMX Partial Mapped Crossover) 2) Lai ghép có trật tự (OX Order Crossover) 3) Lai ghép dựa trên vị trí (Position Based Crossover) 4) Lai ghép dựa trên thứ tự (Order Base Crossover) 5) Lai ghép có chu trình (CX Cycle Crossover) 6) Lai ghép thứ tự tuyến tính (LOX Linear Order Crossover) 2.5.4 Toán tử đột biến Cũng giống nhƣ lai ghép, toán tử đột biến làm tăng nhanh quá trình hội tụ, nhƣng tăng một cách đột ngột, cũng có khi sẽ không gây tác dụng gì một khi không thành công. Không ai có thể đánh giá đƣợc phƣơng pháp đột biến nào tốt hơn, do đó có một vài phƣơng pháp đơn giản, cũng có vài trƣờng hợp khá phức tạp. Ngƣời ta thƣờng chọn một trong những phƣơng pháp sau : 1) Đột biến đảo ngƣợc (Inversion Mutation) 2) Đột biến chèn (Insertion Mutation) 3) Đột biến thay thế (Displacement Mutation) 4) Đột biến tƣơng hỗ (Reciprocal Exchange Mutation) 5) Đột biến chuyển dịch (Shift Mutation) Báo Cáo Đồ Án Tốt Nghiệp _Hoàng Chính Nghĩa _Ct901 16
  17. TÌM HIỂU GIẢI THUẬT DI TRUYỀN ÁP DỤNG GIẢI BÀI TOÁN LẬP LICH 2.5.5 Điều kiện kết thúc Thoát ra quá trình tiến hóa quần thể, dựa vào bài toán mà có các cách kết thúc vấn đề khác nhau, một khi đã đạt đến mức yêu cầu. Một vài trƣờng hợp thông thƣờng nhƣ sau: -Kết thúc theo kết quả: một khi đạt đến mức giá trị yêu cầu thì chấm dứt ngay quá trình thực hiện. -Kết thúc dựa vào số thế hệ: chọn số thế hệ, quá trình sẽ dừng đúng ngay số thế hệ đã qui định trƣớc, không cần biết kết quả nhƣ thế nào. -Tính theo thời gian: không cần biết đã bao nhiêu thế hệ hay kết quả nào, chỉ dựa vào số giờ qui định mà kết thúc. -Tổ hợp: dùng nhiều phƣơng án khác nhau cho vấn đề, chẳng hạn nhƣ : chạy theo số thế hệ xong sau đó đánh giá cho chạy theo kết quả, hoặc ngƣợc lại. CHƢƠNG III- ỨNG DỤNG GIẢI THUẬT DI TRUYỀN VÀO BÀI TOÁN XẾP LỊCH THỜI KHOÁ BIỂU Vấn đề của bài toán khá phức tạp về mặt ràng buộc, nhƣng phƣơng pháp chia để trị vẫn là biện pháp hữu hiệu trong mọi vấn đề phức tạp. ở đây cũng vậy, theo phân cấp các ràng buộc mà ta giải quyết bài toán xếp thời khóa biểu này thành hai giai đoạn khác nhau:  Giai đoạn 1: nhằm giải quyết thành phần ràng buộc ở mức lớp học, với các vấn đề cơ bản phức tạp của những đối tƣợng liên quan tới việc học của Báo Cáo Đồ Án Tốt Nghiệp _Hoàng Chính Nghĩa _Ct901 17
  18. TÌM HIỂU GIẢI THUẬT DI TRUYỀN ÁP DỤNG GIẢI BÀI TOÁN LẬP LICH lớp. Khi đã có đƣợc kết quả cuối cùng là lịch học cho từng lớp một cách hoàn chỉnh, chúng sẽ đƣợc dùng làm thông tin cho giai đoạn sau.  Giai đoạn 2 : tổng hợp lại các ràng buộc còn lại và đã đƣợc đơn giản hóa trong giai đoạn trƣớc. Kết quả của giai đoạn này chính là mục tiêu cuối cùng của bài toán. Đó là lịch học của các lớp trong một cơ sở. Cả hai giai đoạn tuy có mục tiêu và dữ liệu khác nhau, nhƣng về cách giải quyết có tính tƣơng tự nhau, nên không khác gì nhiều khi áp dụng vào mô hình thuật giải di truyền. 3.1 Giai đoạn 1 - xếp lịch học các lớp 3.1.1 Chọn mô hình cá thể Lịch học của một lớp có hai thành phần chính, bao gồm: các môn học và các giờ học trong tuần. Việc đặt ngẫu nhiên các môn học với các giờ học sẽ tạo thành một lịch học cho từng lớp. Nhƣ vậy một lớp học tƣơng ứng sẽ có nhiều lịch học khác nhau, do đó ta chọn mỗi lịch học làm cá thể trong thuật giải di truyền. Và trong hai thành phần đó, thì các giờ học là thành phần ổn định hơn về số lƣợng cũng nhƣ về giá trị của chúng, cho nên ta chọn môn học làm đơn vị nhiễm sắc thể trong cá thể. Vì đối với môn học việc làm nhiễm sắc thể là phù hợp với tính không ổn định của nó : với số lƣợng các môn phụ thuộc từng lớp học, cũng giống nhƣ số lƣợng nhiễm sắc thể trong cá thể, có chiều dài không nhất thiết phải cố định hay bằng nhau. Ngoài ra chƣa kể đến tính phức tạp của môn học về số tiết phải học luôn bị thay đổi, trong khi giá trị các giờ học thì ngƣợc lại, có thể xác định một cách rõ ràng và nhanh chóng. Báo Cáo Đồ Án Tốt Nghiệp _Hoàng Chính Nghĩa _Ct901 18
  19. TÌM HIỂU GIẢI THUẬT DI TRUYỀN ÁP DỤNG GIẢI BÀI TOÁN LẬP LICH Mô hình cá thể trong lịch lớp Môn Môn . . . . . . Môn học 1 học 2 học n Thay vì chọn ngẫu nhiên môn học vào các tiết học nhƣ đã trình bày, chúng ta sẽ làm ngƣợc lại: chọn ngẫu nhiên tiết học theo môn, vì chúng ta đã chọn môn học làm đơn vị trong cá thể ( theo mô hình trên ). Có nghĩa là, với một cá thể của mô hình xếp lịch lớp, ở bất kỳ thời điểm nào, khi ta đặt nhiễm sắc thể đầu tiên nhƣ là môn thứ nhất, nhiễm sắc thể kế tiếp sẽ là môn thứ hai, và tiếp tục cho các nhiễm sắc thể còn lại thì sau này, lúc nào cũng theo thứ tự ấy mà lấy thông tin ra, sẽ không có gì thay đổi ( ngoại trừ giá trị tiết học, nếu nhƣ sau này có xảy ra lai ghép hay đột biến ). Trong trƣờng hợp một môn đƣợc học nhiều lần trong tuần, do có nhiều chứng chỉ / học phần, nên sẽ gây khó khăn cho việc xếp chúng vào trong cá thể. Cách giải quyết vấn đề này rất đơn giản, chỉ cần đƣa chúng vào cá thể với nhiễm sắc thể tƣơng ứng, chẳng khác gì một môn học bình thƣờng khác. Lúc đọc thông tin, chúng ta nên chú ý một chút thế thôi. Ví dụ: Giả sử có danh sách môn học và số lần học trong một tuần nhƣ sau: - Môn học a có 1 lần học. - Môn học b có 2 lần học. - Môn học d có 1 lần học. Chúng ta sẽ phân bổ các nhiễm sắc thể nhƣ sau: Báo Cáo Đồ Án Tốt Nghiệp _Hoàng Chính Nghĩa _Ct901 19
  20. TÌM HIỂU GIẢI THUẬT DI TRUYỀN ÁP DỤNG GIẢI BÀI TOÁN LẬP LICH a b b c D (lần 1) (lần 2) Mỗi nhiễm sắc thể sẽ mang một giá trị số nguyên. Đó chính là vị trí tiết học bắt đầu của môn học. Phạm vi giá trị của nó từ 0 -> 35 theo thứ tự các tiết học trong tuần, đƣợc đánh dấu theo vị trí liên tục của các ngày, tƣơng tự cấu trúc mảng một chiều. Các tiết học tiếp theo là giá trị liên tục kế tiếp nhau tùy theo số lƣợng tiết học của môn mà ta đang lƣu trữ. Giá trị các tiết học. Thứ hai Thứ ba . . . . . . Thứ bảy 0 1 . 5 6 7 . 1 1 . . . 3 3 . 3 . . . . . . 1 2 . . 0 1 . . . 5 Ví dụ: về cách xếp vị trí tiết học trong lịch học. Môn học a tiết bắt đầu 0 số tiết cần học là 3 Môn học b tiết bắt đầu 3 số tiết cần học là 2 Môn học c tiết bắt đầu 8 số tiết cần học là 4 Môn học d tiết bắt đầu 12 số tiết cần học là 3 Phân bố các môn học trên lịch học nhƣ sau: Thứ Thứ Thứ . . . . . . Thứ hai ba tư bảy 0 6 12 30 a(1) 1 7 13 31 Báo Cáo Đồ Án Tốt Nghiệp _Hoàng Chính Nghĩa _Ct901 20
  21. TÌM HIỂU GIẢI THUẬT DI TRUYỀN ÁP DỤNG GIẢI BÀI TOÁN LẬP LICH a(2) 2 8 14 32 a(3) c(1) 3 9 15 33 b(1) c(2) 4 10 16 34 b(2) c(3) 5 11 17 35 c(4) Nhƣ ta đã nói phần trên, tƣơng ứng mỗi cá thể là một lịch học thực thụ của lớp. Vì vậy, khi tạo cá thể, chúng ta vẫn phải đảm bảo sự đúng đắn về tính chất trong lịch học : phải đủ số tiết học, số môn học, không có sự chồng chéo lên nhau tại cùng thời điểm trong các môn Để giải quyết việc này, chúng ta sử dụng một tham biến đánh dấu các tiết học đã lên lịch, để môn học sau sẽ không bị sắp trùng vào những vị trí này, mà môn học này sẽ đƣợc đƣa vào vị trí khác. Tất nhiên, với mỗi lịch học sẽ có sự sắp xếp khác nhau. 3.1.2 Tạo quần thể ban đầu Trƣớc khi tạo quần thể ban đầu trong phần này, chúng ta phải chuẩn bị sẵn về dữ liệu cho quá trình thực thi, từ lúc khởi tạo đến khi cho ra kết quả, bao gồm đầy đủ thông tin của một lớp đang đƣợc chọn. Tất cả nhƣ sau : Các ràng buộc lớp, giáo viên đƣợc phân công dạy. Các môn học và số chứng chỉ từng môn. Tính toán số tiết học tƣơng ứng các môn. Chọn qui định đọc và ghi nhận nhiễm sắc thể. Báo Cáo Đồ Án Tốt Nghiệp _Hoàng Chính Nghĩa _Ct901 21
  22. TÌM HIỂU GIẢI THUẬT DI TRUYỀN ÁP DỤNG GIẢI BÀI TOÁN LẬP LICH Giống nhƣ cá thể đƣợc mô tả ở trên, hàng loạt các cá thể đƣợc tạo ra và đƣợc xem nhƣ quần thể ban đầu trong mô hình thuật giải di truyền của phần xếp lịch lớp. Sau khi quần thể có đủ số lƣợng, bƣớc tiếp theo là đánh giá quần thể, kiểm tra xem độ thích nghi tốt nhất hiện đang tồn tại của quần thể. 3.1.3 Độ thích nghi - chọn cá thể Đây là phần giải quyết các yêu cầu đƣa ra cho bài toán, chủ yếu vẫn xem xét trên các thành phần ràng buộc. Tƣơng ứng với mỗi loại ràng buộc, chúng ta sẽ gán cho chúng một giá trị thích nghi nào đó, mà một khi cá thể đi qua, các ràng buộc đƣợc lắp đặt vào, và sẽ cho ra giá trị thích nghi cụ thể cho cá thể đó, kết thúc công việc tính độ thích nghi. Nghe rất đơn giản nhƣng thực chất đây là vấn đề khó nhất, quan trọng nhất của bài toán. Chi tiết cụ thể nhƣ sau: Trƣớc hết ta nói về giáo viên. Khi chọn phân công giảng dạy, chúng ta phải biết chắc rằng giáo viên đó sẽ trống vào giờ đó, môn đó, buổi đó của lớp học. Hay nói cách khác, chúng ta cần kiểm tra ràng buộc tiết học, mà đã tƣơng ứng với mỗi môn trong lịch học, xem xét lại các môn có thể học giờ đó hay không. Kế tiếp là xét giờ học của lớp. Do một qui định nào đó mà lớp có thể học giờ này hay giờ kia, chẳng hạn nhƣ không học ba tiết đầu trong ngày thứ hai, Cuối cùng kiểm tra lại sự chồng chéo giờ lẫn nhau của các môn học. Việc kiểm tra này nhất thiết phải làm, vì trong lúc lai ghép, đột biến, có thể gây ra sai lệch. Cho nên tốt nhất ta phải kiểm tra chúng. Giống nhƣ lúc khởi động, ta dùng một biến chứa tất cả giờ học ở các môn để giúp cho việc đánh giá. Tƣơng tự các ràng buộc giáo viên và lớp. Mỗi vấn đề sẽ có một biến lƣu trữ giờ làm việc, để Báo Cáo Đồ Án Tốt Nghiệp _Hoàng Chính Nghĩa _Ct901 22
  23. TÌM HIỂU GIẢI THUẬT DI TRUYỀN ÁP DỤNG GIẢI BÀI TOÁN LẬP LICH tránh các tiết học theo qui định mà ta đã ghi nhận cho một giáo viên hay lớp học tƣơng ứng. Có nhiều cách để chọn một cá thể tốt. Chọn cách tính theo độ thích nghi cao nhất hoặc thấp nhất. Thông thƣờng, ngƣời ta chọn cách tính tốt nhất. ở đây, chúng ta cũng chọn cách tính tốt nhất tức là xếp theo giá trị giảm dần của giá trị bị phạt theo độ thích nghi. 3.1.4 Thuật toán lai ghép và đột biến Về thuật toán lai ghép, ta dùng lai ghép đoạn: lấy ngẫu nhiên một đoạn nhiễm sắc thể bên nhiễm sắc thể cha, số còn lại sẽ lấy ở bên nhiễm sắc thể mẹ. Còn thuật toán đột biến : chỉ việc hoán vị hai nhiễm sắc thể một cách ngẫu nhiên trong cá thể. Ta có thể sửa thông số xác xuất về đột biến, lai ghép của chƣơng trình trong lúc chạy thực thi. Phần này áp dụng thực thi cho tất cả các lớp trong một cơ sở, tƣơng ứng với mỗi lớp sẽ có một file lƣu trữ tất cả các lịch lớp mà có thể sử dụng, dƣới hình thức các nhiễm sắc thể trong quẩn thể. Ngoài mục đích xem xét kiểm tra, chúng còn đƣợc dùng làm thông tin để chạy lịch cơ sở sau này. 3.2 Giai đoạn 2 - xếp lịch học cho toàn bộ cơ sở 3.2.1 Chọn mô hình cá thể Lịch học tại cơ sở bao gồm tất cả các lịch học của các lớp hiện có trong cơ sở, nếu mỗi lớp đều có một lịch học rõ ràng thì đó có nghĩa là có lịch cơ sở. Dựa vào giai đoạn đầu, trên mỗi lớp đã cho ra hàng loạt các lịch học, việc chọn ngẫu nhiên lịch học của một lớp thì không có gì khó khăn. Nhìn mô hình cá thể trong Báo Cáo Đồ Án Tốt Nghiệp _Hoàng Chính Nghĩa _Ct901 23
  24. TÌM HIỂU GIẢI THUẬT DI TRUYỀN ÁP DỤNG GIẢI BÀI TOÁN LẬP LICH lịch lớp ta thấy lớp học trong cơ sở có tính chất nhƣ môn học trong lớp, cho nên ta chọn lớp học làm đơn vị của nhiễm sắc thể trong mô hình thuật toán di truyền trong xếp lịch cơ sở. Và tƣơng tự, ta chọn lịch cơ sở làm cá thể. Ở mỗi nhiễm sắc thể là một con số mang tính chất nhƣ một trong những chỉ số trong file lƣu trữ thông tin cá thể của lịch lớp ( chỉ số một lịch học của lớp ). Nhƣ vậy phạm vi giá trị các nhiễm sắc thể sẽ khác nhau, nhƣng ta luôn xác định đƣợc phạm vi đó một cách rõ ràng, chỉ cần đọc giá trị kích thƣớc của file tƣơng ứng của lớp mà thôi. Mô hình cá thể trong lịch cơ sở. Lịch Lịch . . . . . . . Lịch lớp 1 lớp 2 lớp n File 1 0 . . . . n 1 Giống nhƣ trong lịch lớp, cá thể lịch cơ sở cũng phải qua một giai đoạn kiểm tra ban đầu, để có thể ở mức đạt dƣợc dạng đúng của một lịch cơ sở. Đó là Báo Cáo Đồ Án Tốt Nghiệp _Hoàng Chính Nghĩa _Ct901 24
  25. TÌM HIỂU GIẢI THUẬT DI TRUYỀN ÁP DỤNG GIẢI BÀI TOÁN LẬP LICH việc đặt các lớp học vào các phòng trong cơ sở, không phải chọn phòng cho lớp mà là kiểm tra phòng với lớp, xem có thể phù hợp với cơ sở hay không về mặt kích thƣớc hiện có. Nếu việc kiểm tra này không thực hiện đƣợc thì bài toán đến đây đã kết thúc. 3.2.2 Tạo quần thể ban đầu Quần thể khởi đầu gồm những cá thể đƣợc tạo ra nhƣ mô hình trên, nhƣng thông tin các lớp học phải đƣợc chọn cùng trong một buổi học thuộc cơ sở, và có file lịch lớp đầy đủ. ở đây kích thƣớc cá thể là số lớp hiện có, cho nên dài hay ngắn tùy theo cơ sở, cũng giống nhƣ lịch lớp chiều dài đƣợc tính theo số môn hiện có của lớp. Công việc này sẽ tốn rất nhiều thời gian, vì công việc đọc file để kiểm tra, nhƣng quần thể sẽ cho ra kết quả đúng nhất về mặt áp dụng bài toán vào thuật giải di truyền. 3.2.3 Độ thích nghi - chọn cá thể Giai đoạn hội tụ cá thể trong quần thể, trên cơ bản việc đánh giá cơ sở tùy theo số lớp, số giờ học và số phòng học. Phòng học phải hợp lý về sức chứa của nó đối với lớp học, thông thƣờng ngƣời ta chọn phòng lớn nhất cho lớp tƣơng ứng lớn nhất. Nhƣng ở đây ta chọn phƣơng pháp khác, lớp và phòng sẽ đƣợc xếp theo thứ tự lớn dần. Cho nên khi xếp lịch, lớp sẽ đƣợc đặt ở một phòng vừa nhất mà cơ sở đang có. Điều này tuy mất thời gian hơn nhƣng thực tế thì nó sẽ hợp lý hơn. Về vấn đề trùng phòng học giữa các lớp, chúng ta sẽ sử dụng một tham biến ghi nhận tất cả các giờ học của từng phòng một khi có lớp nào vào học, đồng thời sau này đó cũng chính là lịch sử dụng các phòng. Báo Cáo Đồ Án Tốt Nghiệp _Hoàng Chính Nghĩa _Ct901 25
  26. TÌM HIỂU GIẢI THUẬT DI TRUYỀN ÁP DỤNG GIẢI BÀI TOÁN LẬP LICH Cũng đánh giá lại ràng buộc lịch giáo viên, nhƣng lần này chỉ xét về mặt trùng giờ dạy ở các lớp cùng một thời điểm. Tƣơng tự, ta sẽ sử dụng một tham biến lịch dạy cho mỗi giáo viên, để ghi nhận và tránh trƣờng hợp trùng giờ này. Với các lần kiểm tra tƣơng ứng với một giá trị thích nghi, cuối cùng tổng các giá trị này chính là độ thích nghi của cá thể. Công việc không khác gì trong lịch lớp, cá thể đƣợc chọn là cá thể tốt nhất, giá trị thích nghi đạt ở mức đỉnh là 0. 3.2.4 Thuật toán lai ghép và đột biến Sử dụng lại của phần xếp lịch lớp, chọn cá thể theo độ thích nghi, lai ghép ngẫu nhiên đoạn và đột biến hoán vị điểm. Do giống nhau về mặt dữ liệu, và yêu cầu và cấu trúc thuật toán cũng không khác nhau nhiều, việc dùng lại này, sẽ không gây ảnh hƣởng gì trong quá trình thực hiện xếp lịch cơ sở. Một lần nữa nói về thời gian thực thi, sẽ mất nhiều thời gian hơn công việc xếp lịch lớp, do số lƣợng và phạm vi ràng buộc khá lớn và phải đọc dữ liệu trên các file. Nhƣng về mặt hoạt động không khác nhau. 3.2.5 Chọn điểm dừng thuật toán Đã đƣợc nói ở trong từng giai đoạn của các phần áp dụng thuật giải di truyền vào bài toán, điểm dừng thuật toán dựa trên độ thích nghi của nó. Một số bài toán chọn điểm dừng theo số thế hệ, hoặc dựa trên tính tƣơng đối của kết quả, nhƣng với bài toán này cần có một kết thúc tuyệt đối tốt nhất, mặt dù số thế hệ vẫn phải đƣợc chọn trƣớc ngay từ đầu. Vì tính chất yêu cầu trong bài toán này là không bị sai lệch. Nếu trong quá trình thực thi qua các giai đoạn, chỉ cần một kết quả không đạt đến điểm dừng, xem nhƣ bài toán sẽ không có kết quả. Báo Cáo Đồ Án Tốt Nghiệp _Hoàng Chính Nghĩa _Ct901 26
  27. TÌM HIỂU GIẢI THUẬT DI TRUYỀN ÁP DỤNG GIẢI BÀI TOÁN LẬP LICH CHƢƠNG IV- THIẾT KẾ HỆ THỐNG LẬP LỊCH THỜI KHÓA BIỂU 4.1 Thiết kế cơ sở dữ liệu bài toán Khi tạo một lịch lớp học chúng ta cần xem xét đến rất nhiều các yêu cầu về số lƣợng giảng viên, học sinh, số lớp học, phòng học, kích cỡ của phòng học trang thiết bị trong lớp học( máy tính, máy chiếu ) và nhiều yếu tố khác. Các yêu cầu này có thể đƣợc chia thành nhiều nhóm tuỳ theo tầm quan trọng của chúng. Các yêu cầu bắt buộc (nếu vi phạm một trong những yêu cầu này, lịch học sẽ thành vô hiệu, bất khả thi): - Lớp chỉ có thể diễn ra trong phòng học - Không giảng viên hay một nhóm sinh viên nào có thể ở nhiều lớp học cùng một lúc - Lớp học phải đủ chỗ cho tất cả học sinh - Để lớp học diễn ra trong phòng học, lớp học phải có các thiết bị nếu cần thiết Một số yêu cầu không bắt buộc nếu vi phạm lịch học vẫn khả thi: - Thời gian học của lớp đƣợc ƣu tiên cho giảng viên - Phòng học có thể do giảng viên chọn - Phân bổ (thời gian hoặc không gian) của các lớp học dành cho các nhóm sinh viên hoặc giảng viên. Các yêu cầu bắt buộc hoặc không bắt buộc của khóa học tùy thuộc vào hoàn cảnh cụ thể. Trong hệ thống lập lịch thời khóa biểu này chỉ đề cập đến những yêu cầu bắt buộc. Báo Cáo Đồ Án Tốt Nghiệp _Hoàng Chính Nghĩa _Ct901 27
  28. TÌM HIỂU GIẢI THUẬT DI TRUYỀN ÁP DỤNG GIẢI BÀI TOÁN LẬP LICH 4.2 Các đối tƣợng của lịch học Giảng viên Phần giảng viên có ID( chỉ danh) và tên của giảng viên. Nó cũng chứa danh sách các lớp mà giảng viên đó dạy Nhóm sinh viên Phần nhóm sinh viên chứa danh tính và tên của nhóm sinh viên , cũng nhƣ số lƣợng sinh viên( kích cỡ của nhóm). Nó cũng chứa danh sách các lớp học mà nhóm tham gia học. Phòng học Phần phòng học chứa ID và tên của phòng học, cũng nhƣ số lƣợng chỗ ngồi và máy tính( nếu có) trong đó. Nếu phòng học có máy tính, dự kiến có thể mỗi chỗ ngồi có một máy tính. Các ID đƣợc tạo ra nội bộ và tự động Khoá học Phần khóa học có ID và tên khóa học Lớp học Phần lớp học giới thiệu về khóa học của lớp học đó, chỉ ra giảng viên và danh sách nhóm sinh viên tham dự các lớp của giảng viên đó. Phần này cũng đƣa ra số lƣợng chỗ ngồi cần thiết( số lƣợng của nhóm sinh viên) , lƣợng máy tính trong lớp học (nếu cần) và thời lƣợng của lớp học ( tính bằng giờ). 4.3 Biểu diễn nhiễm sắc thể Để trình bày một nhiễm sắc thể ta cần một slot cho mỗt phòng học hàng ngày trong thời khóa biểu. Ngoài ra, chúng ta khẳng định rằng không thể bắt đầu các lớp học trƣớc 7 giờ sáng và nên kết thúc trƣớc hoặc vào lúc 7 đêm (tổng là 12giờ) và ngày làm việc là từ thứ Hai đến thứ Sáu (tổng là 5 ngày).Vì vậy, chúng Báo Cáo Đồ Án Tốt Nghiệp _Hoàng Chính Nghĩa _Ct901 28
  29. TÌM HIỂU GIẢI THUẬT DI TRUYỀN ÁP DỤNG GIẢI BÀI TOÁN LẬP LICH ta cần điều chỉnh số lớp học là (12*5*số của phòng học). Các slot sau đƣợc kế thừa từ các slot trƣớc bởi vì trong quá trình thực hiện thuật toán chúng ta cho phép nhiều lớp học tại một thời điểm slot. Ta dùng thêm một ánh xạ là một bảng băm để lấy slot tại thời điểm lớp học bắt đầu( vị trí của nó theo vectơ) từ địa chỉ đối tƣợng của lớp. Mỗi giờ của một lớp học có mục nhập riêng biệt trong véc tơ, nhƣng chỉ có một mục nhập cho mỗi lớp học trong ánh xạ bảng băm Biểu diễn cá thể Nhiễm sắc thể với số lƣợng là 100 đƣợc biểu diễn bằng một lớp Schedule và nó đƣợc lƣu trữ trong 2 thuộc tính Các khe thời gian, mỗi khe sẽ biểu diễn một giờ trong một lớp học Vector<list<CourseClass*>>_slots; Bảng lớp dành cho nhiễm sắc thể dược dùng để quyết định slot đầu tiên của lớp //Được sử dụng để quyết định khe thời gian đầu tiên được sử dụng bởi lớp học Báo Cáo Đồ Án Tốt Nghiệp _Hoàng Chính Nghĩa _Ct901 29
  30. TÌM HIỂU GIẢI THUẬT DI TRUYỀN ÁP DỤNG GIẢI BÀI TOÁN LẬP LICH Hash_map<CourseClass*, int> _classes; Đồng thời nhiễm sắc thể đƣợc lƣu trữ những giá trị phù hợp và những tham số bằng việc sử dụng các thao táo của giải thuật Những giá trị phù hợp đƣợc lƣu trữ tại: Float_fitness; //Các cờ của sự thỏa các rang buộc lớp Vector<bool>_criteria; 4.4 Các tham số của giải thuật di truyền Số điểm lai ghép của các bảng lớp cha mẹ int_numberOfCrossoverPoints= 2 ; Số lượng những lớp mà được di chuyển ngẫu nhiên bởi thao tác đột biến đơn giản int_mutationSize= 2 ; Xác suất lai ghép sẽ xảy ra int_crossoverProbability= 80% ; Xác suất đột biến sẽ xảy ra int_mutationProbability= 3% ; 4.4.1 Phép lai ghép Nhƣ đã nói ở trên phép lai ghép diễn ra bằng cách ghép một hay nhiều đoạn gen từ hai nhiễm sắc thể cha-mẹ để hình thành nhiễm sắc thể mới mang đặc tính của cả cha lẫn mẹ. Ví dụ: Báo Cáo Đồ Án Tốt Nghiệp _Hoàng Chính Nghĩa _Ct901 30
  31. TÌM HIỂU GIẢI THUẬT DI TRUYỀN ÁP DỤNG GIẢI BÀI TOÁN LẬP LICH Trong hệ thống này thao tác lai ghép ban đầu kiểm tra một số bất kì với xác suất lai ghép nếu lớn hơn sẽ tiến hành lai ghép và trả ra một nhiễm sắc thể gọi là nhiễm sắc thể đầu tiên. Quá trình lựa chọn các điểm lai ghép là ngẫu nhiên if( rand() % 100 > _crossoverProbability ) return new Schedule( *this, false ); Schedule* n = new Schedule( *this, true ); int size = (int)_classes.size(); vector cp( size ); for( int i = _numberOfCrossoverPoints; i > 0; i ) { while( 1 ) { int p = rand() % size; if( !cp[ p ] ) { cp[ p ] = true; break; } } } Quá trình lai ghép kết hợp các dữ liệu trong bảng băm của hai nhiễm sắc thể cha mẹ, và sau đó nó tạo ra véc tơ của các slot theo nội dung của bảng băm mới. Lai ghép 'Tách' bẳng băm của cả hai nhiễm sắc thể cha mẹ thành các phần có kích thƣớc ngẫu nhiên. Số của các thành phần đƣợc xác định bởi số lƣợng các điểm lai ghép (cộng thêm một) theo các tham số của nhiễm sắc thể. Sau đó, nó sao chép thay luân phiên các phần nhiễm sắc thể cha mẹ mẫu thành các nhiễm sắc thể mới, và các hình thức thao tác lai ghép Báo Cáo Đồ Án Tốt Nghiệp _Hoàng Chính Nghĩa _Ct901 31
  32. TÌM HIỂU GIẢI THUẬT DI TRUYỀN ÁP DỤNG GIẢI BÀI TOÁN LẬP LICH hash_map ::const_iterator it1 = _classes.begin(); hash_map ::const_iterator it2 = parent2._classes.begin(); bool first = rand() % 2 == 0; for( int i = 0; i _classes.insert( pair ( ( *it1 ).first, ( *it1 ).second ) ); // Tất cả các slot của lớp được sao chép for( int i = ( *it1 ).first->GetDuration() - 1; i >= 0; i ) n->_slots[ ( *it1 ).second + i ].push_back( ( *it1 ).first ); } else { // Chèn lớp từ nst cha mẹ ở thế hệ thứ 2 vào bảng nst mới n->_classes.insert( pair ( ( *it2 ).first, ( *it2 ).second ) ); // Tất cả các slot của lớp được sao chép for( int i = ( *it2 ).first->GetDuration() - 1; i >= 0; i ) n->_slots[ ( *it2 ).second + i ].push_back( ( *it2 ).first ); } // Số điểm lai ghép if( cp[ i ] ) first = !first; it1++; it2++; } Báo Cáo Đồ Án Tốt Nghiệp _Hoàng Chính Nghĩa _Ct901 32
  33. TÌM HIỂU GIẢI THUẬT DI TRUYỀN ÁP DỤNG GIẢI BÀI TOÁN LẬP LICH 4.4.2 Phép đột biến Cũng giống nhƣ vậy phép đột biến diễn ra bằng cách khi một hoặc một số tình trạng của con không đƣợc thừa hƣởng từ hai chuỗi nhiễm sắc thể cha mẹ. Phép đột biến xảy ra với xác suất thấp hơn rất nhiều so với xác suất xảy ra phép lai ghép. Ví dụ: Trong hệ thống này thao tác đột biến ban đầu kiểm tra xác suất đột biến với một số bất kì if( rand() % 100 > _mutationProbability ) return; Báo Cáo Đồ Án Tốt Nghiệp _Hoàng Chính Nghĩa _Ct901 33
  34. TÌM HIỂU GIẢI THUẬT DI TRUYỀN ÁP DỤNG GIẢI BÀI TOÁN LẬP LICH Sau đó thao tác đột biến tạo ra một lớp ngẫu nhiên và di chuyển nhiễm sắc thể đến một slot cũng đƣợc lựa chọn ngẫu nhiên khác. Số của lớp học đó sẽ đƣợc di chuyển vào một thao tác đơn lẻ đƣợc xác định bởi kích thƣớc đột biến trong các tham số của nhiễm sắc thể // Lựa chọn điểm của lớp một cách ngẫu nhiên int nr = Configuration::GetInstance().GetNumberOfRooms(); int dur = cc1->GetDuration(); int day = rand() % DAYS_NUM; int room = rand() % nr; int time = rand() % ( DAY_HOURS + 1 - dur ); int pos2 = day * nr * DAY_HOURS + room * DAY_HOURS + time; // Di chuyển slot for( int i = dur - 1; i >= 0; i ) { // Lo ại b ỏ giờ các lớp từ slot thời gian hiện thời list & cl = _slots[ pos1 + i ]; for( list ::iterator it = cl.begin(); it != cl.end(); it++ ) { if( *it == cc1 ) { cl.erase( it ); break; } } // Di chuyển giờ lớp tới các slot thời gian mới _slots.at( pos2 + i ).push_back( cc1 ); // Thay đổi đầu vào của bảng lớp để chỉ tới các slot (khe) thời gian mới _classes[ cc1 ] = pos2; 4.6 Độ thích nghi Đây là phần giải quyết các yêu cầu đƣa ra cho bài toán, chủ yếu vẫn xem xét trên các thành phần ràng buộc. Tƣơng ứng với mỗi loại ràng buộc chúng ta sẽ Báo Cáo Đồ Án Tốt Nghiệp _Hoàng Chính Nghĩa _Ct901 34
  35. TÌM HIỂU GIẢI THUẬT DI TRUYỀN ÁP DỤNG GIẢI BÀI TOÁN LẬP LICH gán cho chúng một giá trị thích nghi nào đó, mà một khi cá thể đi qua, các ràng buộc đƣợc lắp đặt vào, và sẽ cho ra giá trị thích nghi cụ thể cho cá thể đó, kết thúc công việc tính độ thích nghi Bây giờ chúng ta cần phải ấn định một giá trị thích hợp cho các nhiễm sắc thể. Ta sẽ áp dụng các yêu cầu tối thiểu cho lịch học của một lớp (không có gì lạ, ví dụ, chúng ta công nhận rằng giảng viên có thể đứng lớp bất cứ lúc nào).Cách làm nhƣ sau: Mỗi lớp học có thể có từ 0 đến 5 vị trí. Nếu lớp học sử dụng phòng trống, ta gia tăng score của nó. bool ro = false; for( int i = dur - 1; i >= 0; i ) { if( _slots[ p + i ].size() > 1 ) { ro = true; break; } } if( !ro ) score++; _criteria[ ci + 0 ] = !ro; Nếu các lớp học đòi hỏi phải có máy tính trong phòng học, ta tăng score của nó. Nhƣng nếu lớp học không cần máy tính, chúng ta cũng tăng score của nó bằng mọi cách. _criteria[ ci + 2 ] = !cc->IsLabRequired() || ( cc->IsLabRequired() && r->IsLab() ); if( _criteria[ ci + 2 ] ) score++; Báo Cáo Đồ Án Tốt Nghiệp _Hoàng Chính Nghĩa _Ct901 35
  36. TÌM HIỂU GIẢI THUẬT DI TRUYỀN ÁP DỤNG GIẢI BÀI TOÁN LẬP LICH Nếu lớp học ở phòng có đủ chỗ ngồi, ta tăng score của nó. _criteria[ ci + 1 ] = r->GetNumberOfSeats()>cc>GetNumberOfSeats(); if( _criteria[ ci + 1 ] ) score++; Nếu giảng viên hiện có thể lên lớp ( không có lớp học khác) tại thời điểm đó, chúng ta tăng score của lớp lên một lần nữa. Và tiêu chí cuối cùng chúng ta cần kiểm tra là liệu nhóm sinh viên của lớp có phải học ở một lớp nào khác tại cùng một thời điểm không, và nếu không chúng ta tăng score của lớp đó. for( int i = numberOfRooms, t = day * daySize + time; i > 0; i ,t += DAY_HOURS ) { for( int i = dur - 1; i >= 0; i ) { const list & cl =_slots[ t + i ]; for( list ::const_iterator it =cl.begin(); it != cl.end(); it++ ) { if( cc != *it ) { if( !po && cc>ProfessorOverlaps( it ) ) po = true; if( !go && cc->GroupsOverlap( it ) ) go = true; if( po && go ) goto total_overlap; } } } } total_overlap: if( !po ) Báo Cáo Đồ Án Tốt Nghiệp _Hoàng Chính Nghĩa _Ct901 36
  37. TÌM HIỂU GIẢI THUẬT DI TRUYỀN ÁP DỤNG GIẢI BÀI TOÁN LẬP LICH score++; _criteria[ ci + 3 ] = !po; if( !go ) score++; _criteria[ ci + 4 ] = !go; Tổng số của lịch là tổng hợp tất cả các mặt của lớp học. _fitness = (float)score / Configuration::GetInstance().GetNumberOfCourseClasses() * DAYS_NUM ); 4.7 Chƣơng trình thực nghiệm Kết quả và demo chạy thử nghiệm chƣơng trình lập lịch thời khoá biểu bằng giải thuật di truyền. Chƣơng trình demo bao gồm phần cơ sở dữ liệu tạo ra 2 phòng( room 1 và room 2) với tên giáo viên, tên môn học, tên phòng học, số giờ học ( quy định là 2h), lớp học với các thuộc tính đƣợc lập trình sẵn. Chƣơng trình sẽ dừng khi hàm Fitness có giá trị bằng 1.00000 Chƣơng trình Thử nghiệm Báo Cáo Đồ Án Tốt Nghiệp _Hoàng Chính Nghĩa _Ct901 37
  38. TÌM HIỂU GIẢI THUẬT DI TRUYỀN ÁP DỤNG GIẢI BÀI TOÁN LẬP LICH Báo Cáo Đồ Án Tốt Nghiệp _Hoàng Chính Nghĩa _Ct901 38
  39. TÌM HIỂU GIẢI THUẬT DI TRUYỀN ÁP DỤNG GIẢI BÀI TOÁN LẬP LICH Báo Cáo Đồ Án Tốt Nghiệp _Hoàng Chính Nghĩa _Ct901 39
  40. TÌM HIỂU GIẢI THUẬT DI TRUYỀN ÁP DỤNG GIẢI BÀI TOÁN LẬP LICH Kết luận và hƣớng phát triển I. Kết quả đạt đƣợc *Áp dụng đƣợc giải thuật di truyền để giải quyết bài toán sắp thời khoá biểu. Xây dựng thành công chƣơng trình demo sắp xếp thời khoá biểu II. Hạn chế - Hƣớng phát triển trong tƣơng lai 1. Hạn chế: + Do giải thuật di truyền mang tính chất ngẫu nhiên nên đôi khi kết quả đạt đƣợc không phải là 100%. + Giải thuật Di Truyền có thể giải quyết bài toán tối ƣu bất kỳ (cực tiểu hóa hàm mục tiêu) với n biến vào. Tuy nhiên, với số lƣợng biến vào khá nhiều, các giá trị hàm mục tiêu đạt đƣợc thƣờng không gần với kết quả tối ƣu thực sự. Để khắc phục vấn đề này, có thể tăng số lƣợng vòng lặp, hy vọng lần sinh sản muộn sẽ hình thành những con cháu với độ thích nghi cao ứng với các giá trị hàm mục tiêu gần kết quả tối ƣu thực sự nhất. 2. Hƣớng phát triển trong tƣơng lai + Sắp thời khóa biểu thực hành theo nhiều mức độ ƣu tiên hơn( ƣu tiên cho giảng viên .). + Hoàn thiện một số các chức năng hiệu chỉnh để ngƣời dùng có thể linh động hơn trong quá trình hiệu chỉnh. Báo Cáo Đồ Án Tốt Nghiệp _Hoàng Chính Nghĩa _Ct901 40
  41. TÌM HIỂU GIẢI THUẬT DI TRUYỀN ÁP DỤNG GIẢI BÀI TOÁN LẬP LICH Tài Liệu Tham Khảo  Lập trình tiến hoá_Ts. Nguyễn Đình Thúc  Giới thiệu giải thuật Di truyền và Tính toán Tiến hóa _PGS.TS Randy Ribler khoa tin trƣờng đại học Lynchburg,VA,USA     Báo Cáo Đồ Án Tốt Nghiệp _Hoàng Chính Nghĩa _Ct901 41