Bài giảng Lý thuyết đồ thị - Chương 5: Cây

pdf 55 trang huongle 3670
Bạn đang xem 20 trang mẫu của tài liệu "Bài giảng Lý thuyết đồ thị - Chương 5: Cây", để tải tài liệu gốc về máy bạn click vào nút DOWNLOAD ở trên

Tài liệu đính kèm:

  • pdfbai_giang_ly_thuyet_do_thi_chuong_5_cay.pdf

Nội dung text: Bài giảng Lý thuyết đồ thị - Chương 5: Cây

  1. CHƯƠNG 5 CÂY Ths. Nguyễn Khắc Quốc IT.Deparment – Tra Vinh University 1
  2. TỔNG QUAN. - Một đồ thị liên thông và không có chu trình được gọi là cây. - Cây được dùng từ năm 1857- nhà toán học Anh Arthur Cayley dùng cây để xác định những dạng khác nhau của hợp chất hoá học. - Cây đã được dùng để giải nhiều bài toán trong nhiều lĩnh vực khác nhau. - Cây rất hay được sử dụng trong tin học. - Xây dựng các thuật toán rất có hiệu quả để định vị các phần tử trong một danh sách. ThS. Nguyễn Khắc Quốc 2
  3. TỔNG QUAN. - Xây dựng các mạng máy tính với chi phí rẻ nhất cho các đường điện thoại nối các máy phân tán. - Tạo ra các mã có hiệu quả để lưu trữ và truyền dữ liệu. - Mô hình các thủ tục mà để thi hành nó cần dùng một dãy các quyết định. Cây đặc biệt có giá trị khi nghiên cứu các thuật toán sắp xếp. ThS. Nguyễn Khắc Quốc 3
  4. 5.1. ĐỊNH NGHĨA VÀ CÁC TÍNH CHẤT CƠ BẢN. 5.1.1. Định nghĩa: - Cây là một đồ thị vô hướng liên thông, không chứa chu trình và có ít nhất hai đỉnh. - Một đồ thị vô hướng không chứa chu trình và có ít nhất hai đỉnh gọi là một rừng. - Trong một rừng, mỗi thành phần liên thông là một cây. ThS. Nguyễn Khắc Quốc 4
  5. 5.1. ĐỊNH NGHĨA VÀ CÁC TÍNH CHẤT CƠ BẢN. Thí dụ: Rừng gồm 3 cây ThS. Nguyễn Khắc Quốc 5
  6. 5.1. ĐỊNH NGHĨA VÀ CÁC TÍNH CHẤT CƠ BẢN. 5.1.2. Mệnh đề: - Nếu T là một cây có n đỉnh thì T có ít nhất hai đỉnh treo. Chứng minh: - Lấy một cạnh (a,b) tuỳ ý của cây T. - Trong tập hợp các đường đi sơ cấp chứa cạnh (a,b), ta lấy đường đi từ u đến v dài nhất. - Vì T là một cây nên u v. - Mặt khác, u và v phải là hai đỉnh treo, vì nếu một đỉnh, u chẳng hạn, không phải là đỉnh treo thì u phải là đầu mút của một cạnh (u,x), với x là đỉnh không thuộc đường đi từ u đến v. - Do đó, đường đi sơ cấp từ x đến v, chứa cạnh (a,b), dài hơn đường đi từ u đến v, trái với tính chất đường đi từ u đến v đã chọn. ThS. Nguyễn Khắc Quốc 6
  7. 5.1. ĐỊNH NGHĨA VÀ CÁC TÍNH CHẤT CƠ BẢN. 6.1.3. Định lý: - Cho T là một đồ thị có n 2 đỉnh. Các điều sau là tương đương: 1) T là một cây. 2) T liên thông và có n 1 cạnh. 3) T không chứa chu trình và có n 1 cạnh. 4) T liên thông và mỗi cạnh là cầu. 5) Giữa hai đỉnh phân biệt bất kỳ của T luôn có duy nhất một đường đi sơ cấp. 6) T không chứa chu trình nhưng khi thêm một cạnh mới thì có được một chu trình duy nhất. ThS. Nguyễn Khắc Quốc 7
  8. 5.1. ĐỊNH NGHĨA VÀ CÁC TÍNH CHẤT CƠ BẢN. Chứng minh: 1) 2) Chỉ cần chứng minh rằng một cây có n đỉnh thì có n 1 cạnh. - Ta chứng minh bằng quy nạp. - Điều này hiển nhiên khi n=2. - Giả sử cây có k đỉnh thì có k 1 cạnh, ta chứng minh rằng cây T có k+1 đỉnh thì có k cạnh. - Thật vậy, trong T nếu ta xoá một đỉnh treo và cạnh treo tương ứng thì đồ thị nhận được là một cây k đỉnh, cây này có k 1 cạnh, theo giả thiết quy nạp. - Vậy cây T có k cạnh. ThS. Nguyễn Khắc Quốc 8
  9. 5.1. ĐỊNH NGHĨA VÀ CÁC TÍNH CHẤT CƠ BẢN. Chứng minh: 2) 3) Nếu T có chu trình thì bỏ đi một cạnh trong chu trình này thì T vẫn liên thông. - Làm lại như thế cho đến khi trong T không còn chu trình nào mà vẫn liên thông, - Lúc đó ta được một cây có n đỉnh nhưng có ít hơn n 1 cạnh, trái với 2). ThS. Nguyễn Khắc Quốc 9
  10. 5.1. ĐỊNH NGHĨA VÀ CÁC TÍNH CHẤT CƠ BẢN. Chứng minh: 3) 4) Nếu T có k thành phần liên thông T1, ,Tk lần lượt có số đỉnh là n1, , nk (với n1+n2 ++nk=n) thì mỗi Ti là một cây nên nó có số cạnh là ni 1. - Vậy ta có n 1=(n1 1)+(n2 1)+ +(nk 1)=(n1+n2++nk) k=n k. - Do đó k=1 hay T liên thông. - Hơn nữa, khi bỏ đi một cạnh thì T hết liên thông, vì nếu còn liên thông thì T là một cây n đỉnh với n 2 cạnh, trái với điều đã chứng minh ở trên. ThS. Nguyễn Khắc Quốc 10
  11. 5.1. ĐỊNH NGHĨA VÀ CÁC TÍNH CHẤT CƠ BẢN. Chứng minh: 4) 5) Vì T liên thông nên giữa hai đỉnh phân biệt bất kỳ của T luôn có một đường đi sơ cấp, - Nhưng không thể được nối bởi hai đường đi sơ cấp - Vì nếu thế, hai đường đó sẽ tạo ra một chu trình và khi bỏ một cạnh thuộc chu trình này T vẫn liên thông, trái với giả thiết. ThS. Nguyễn Khắc Quốc 11
  12. 5.1. ĐỊNH NGHĨA VÀ CÁC TÍNH CHẤT CƠ BẢN. Chứng minh: 5) 6) Nếu T chứa một chu trình thì hai đỉnh bất kỳ trên chu trình này sẽ được nối bởi hai đường đi sơ cấp. - Ngoài ra, khi thêm một cạnh mới (u,v), cạnh này sẽ tạo nên với đường đi sơ cấp duy nhất nối u và v một chu trình duy nhất. 6) 1) Nếu T không liên thông thì thêm một cạnh nối hai đỉnh ở hai thành phần liên thông khác nhau ta không nhận được một chu trình nào. Vậy T liên thông, do đó nó là một cây. ThS. Nguyễn Khắc Quốc 12
  13. 6.2. CÂY KHUNG VÀ BÀI TOÁN TÌM CÂY KHUNG NHỎ NHẤT. 6.2.1. Định nghĩa: - Trong đồ thị liên thông G, nếu ta loại bỏ cạnh nằm trên chu trình nào đó thì ta sẽ được đồ thị vẫn là liên thông. - Nếu cứ loại bỏ các cạnh ở các chu trình khác cho đến khi nào đồ thị không còn chu trình (vẫn liên thông) thì ta thu được một cây nối các đỉnh của G. - Cây đó gọi là cây khung hay cây bao trùm của đồ thị G. ThS. Nguyễn Khắc Quốc 13
  14. 6.2. CÂY KHUNG VÀ BÀI TOÁN TÌM CÂY KHUNG NHỎ NHẤT (tt). - Tổng quát, nếu G là đồ thị có n đỉnh, m cạnh và k thành phần liên thông thì áp dụng thủ tục vừa mô tả đối với mỗi thành phần liên thông của G, ta thu được đồ thị gọi là rừng khung của G. - Số cạnh bị loại bỏ trong thủ tục này bằng m n+k, số này ký hiệu là (G) và gọi là chu số của đồ thị G. ThS. Nguyễn Khắc Quốc 14
  15. 6.2. CÂY KHUNG VÀ BÀI TOÁN TÌM CÂY KHUNG NHỎ NHẤT (tt). 6.2.2. Bài toán tìm cây khung nhỏ nhất: -Là một trong số những bài toán tối ưu trên đồ thị có nhiều ứng dụng trong nhiều lĩnh vực khác nhau của đời sống. - Nội dung của bài toán: Cho G=(V,E) là đồ thị vô hướng liên thông có trọng số, mỗi cạnh e E có trọng số m(e) 0. Giả sử T=(VT,ET) là cây khung của đồ thị G (VT=V). Ta gọi độ dài m(T) của cây khung T là tổng trọng số của các cạnh của nó: ThS. Nguyễn Khắc Quốc 15
  16. 6.2. CÂY KHUNG VÀ BÀI TOÁN TÌM CÂY KHUNG NHỎ NHẤT (tt). Bài toán đặt ra là trong số tất cả các cây khung của đồ thị G, hãy tìm cây khung có độ dài nhỏ nhất. - Cây khung như vậy được gọi là cây khung nhỏ nhất của đồ thị và bài toán đặt ra được gọi là bài toán tìm cây khung nhỏ nhất. Để minh hoạ cho những ứng dụng của bài toán cây khung nhỏ nhất, dưới đây là hai mô hình thực tế tiêu biểu cho nó. ThS. Nguyễn Khắc Quốc 16
  17. 6.2. CÂY KHUNG VÀ BÀI TOÁN TÌM CÂY KHUNG NHỎ NHẤT (tt). Bài toán xây dựng hệ thống đường sắt: - Giả sử ta muốn xây dựng một hệ thống đường sắt nối n thành phố sao cho hành khách có thể đi từ bất cứ một thành phố nào đến bất kỳ một trong số các thành phố còn lại. - Trên quan điểm kinh tế đòi hỏi là chi phí về xây dựng hệ thống đường phải là nhỏ nhất. - Rõ ràng là đồ thị mà đỉnh là các thành phố còn các cạnh là các tuyến đường sắt nối các thành phố tương ứng, với phương án xây dựng tối ưu phải là cây. - Vì vậy, bài toán đặt ra dẫn về bài toán tìm cây khung nhỏ nhất trên đồ thị đầy đủ n đỉnh, mỗi đỉnh tương ứng với một thành phố với độ dài trên các cạnh chính là chi phí xây dựng hệ thống đường sắt nối hai thành phố. ThS. Nguyễn Khắc Quốc 17
  18. 6.2. CÂY KHUNG VÀ BÀI TOÁN TÌM CÂY KHUNG NHỎ NHẤT (tt). Bài toán nối mạng máy tính: - Cần nối mạng một hệ thống gồm n máy tính đánh số từ 1 đến n. - Biết chi phí nối máy i với máy j là m(i,j) (thông thường chi phí này phụ thuộc vào độ dài cáp nối cần sử dụng). - Hãy tìm cách nối mạng sao cho tổng chi phí là nhỏ nhất. - Bài toán này cũng dẫn về bài toán tìm cây khung nhỏ nhất. Bài toán tìm cây khung nhỏ nhất đã có những thuật toán rất hiệu quả để giải chúng. Ta sẽ xét hai trong số những thuật toán như vậy: + Thuật toán Kruskal + Thuật toán Prim. ThS. Nguyễn Khắc Quốc 18
  19. 6.2. CÂY KHUNG VÀ BÀI TOÁN TÌM CÂY KHUNG NHỎ NHẤT (tt). 6.2.3. Thuật toán Kruskal: - Thuật toán sẽ xây dựng tập cạnh ET của cây khung nhỏ nhất T=(VT, ET) theo từng bước. - Trước hết sắp xếp các cạnh của đồ thị G theo thứ tự không giảm của trọng số. - Bắt đầu từ ET=, ở mỗi bước ta sẽ lần lượt duyệt trong danh sách cạnh đã sắp xếp, từ cạnh có độ dài nhỏ đến cạnh có độ dài lớn hơn, để tìm ra cạnh mà việc bổ sung nó vào tập ET không tạo thành chu trình trong tập này. - Thuật toán sẽ kết thúc khi ta thu được tập ET gồm n 1 cạnh. ThS. Nguyễn Khắc Quốc 19
  20. 6.2. CÂY KHUNG VÀ BÀI TOÁN TÌM CÂY KHUNG NHỎ NHẤT (tt). Mô tả thuật toán: 1. Bắt đầu từ đồ thị rỗng T có n đỉnh. 2. Sắp xếp các cạnh của G theo thứ tự không giảm của trọng số. 3. Bắt đầu từ cạnh đầu tiên của dãy này, ta cứ thêm dần các cạnh của dãy đã được xếp vào T theo nguyên tắc cạnh thêm vào không được tạo thành chu trình trong T. 4. Lặp lại Bước 3 cho đến khi nào số cạnh trong T bằng n 1, ta thu được cây khung nhỏ nhất cần tìm. ThS. Nguyễn Khắc Quốc 20
  21. 6.2. CÂY KHUNG VÀ BÀI TOÁN TÌM CÂY KHUNG NHỎ NHẤT (tt). Thí dụ: Tìm cây khung nhỏ nhất của đồ thị - Bắt đầu từ đồ thị rỗng T có 6 đỉnh. - Sắp xếp các cạnh của đồ thị theo thứ tự không giảm của trọng số: {(v3, v5), (v4, v6), (v4, v5), (v5, v6), (v3, v4), (v1, v3), (v2, v3), (v2, v4), (v1, v2)}. - Thêm vào đồ thị T cạnh (v3, v5). ThS. Nguyễn Khắc Quốc 21
  22. 6.2. CÂY KHUNG VÀ BÀI TOÁN TÌM CÂY KHUNG NHỎ NHẤT (tt). Thí dụ: - Do số cạnh của T là 1<6 1 nên tiếp tục thêm cạnh (v4, v6) vào T. - Bây giờ số cạnh của T đã là 2 vẫn còn nhỏ hơn 6, ta tiếp tục thêm cạnh tiếp theo trong dãy đã sắp xếp vào T. - Sau khi thêm cạnh (v4, v5) vào T, nếu thêm cạnh (v5, v6) thì nó sẽ tạo thành với 2 cạnh (v4, v5), (v4, v6) đã có trong T một chu trình. - Tình huống tương tự cũng xãy ra đối với cạnh (v3, v4) là cạnh tiếp theo trong dãy. - Tiếp theo ta bổ sung cạnh (v1, v3), (v2, v3) vào T và thu dược tập ET gồm 5 cạnh: {(v3, v5), (v4, v6), (v4, v5), (v1, v3), (v2, v3)}. ThS. Nguyễn Khắc Quốc 22
  23. 6.2. CÂY KHUNG VÀ BÀI TOÁN TÌM CÂY KHUNG NHỎ NHẤT (tt). Tính đúng đắn của thuật toán: - Rõ ràng đồ thị thu được theo thuật toán có n 1 cạnh và không có chu trình. - Vì vậy theo Định lý 6.1.3, nó là cây khung của đồ thị G. - Như vậy chỉ còn phải chỉ ra rằng T có độ dài nhỏ nhất. - Giả sử tồn tại cây khung S của đồ thị mà m(S)<m(T). - Ký hiệu ek là cạnh đầu tiên trong dãy các cạnh của T xây dựng theo thuật toán vừa mô tả không thuộc S. - Khi đó đồ thị con của G sinh bởi cây S được bổ sung cạnh ek sẽ chứa một chu trình duy nhất C đi qua ek. ThS. Nguyễn Khắc Quốc 23
  24. 6.2. CÂY KHUNG VÀ BÀI TOÁN TÌM CÂY KHUNG NHỎ NHẤT (tt). - Do chu trình C phải chứa cạnh e thuộc S nhưng không thuộc T nên đồ thị con thu được từ S bằng cách thay cạnh e của nó bởi ek, ký hiệu đồ thị này là S’, sẽ là cây khung. - Theo cách xây dựng, m(ek) m(e), do đó m(S’) m(S), đồng thời số cạnh chung của S’ và T đã tăng thêm một so với số cạnh chung của S và T. - Lặp lại quá trình trên từng bước một, ta có thể biến đổi S thành T và trong mỗi bước tổng độ dài không tăng, tức là m(T) m(S). - Mâu thuẫn này chứng tỏ T là cây khung nhỏ nhất của G. ThS. Nguyễn Khắc Quốc 24
  25. 6.2. CÂY KHUNG VÀ BÀI TOÁN TÌM CÂY KHUNG NHỎ NHẤT (tt). Độ phức tạp của thuật toán Kruskal: -Trước tiên, ta sắp xếp các cạnh của G theo thứ tự có chiều dài tăng dần; việc sắp xếp này có độ phức tạp O(p2), với p là số cạnh của G. - Người ta chứng minh được rằng việc chọn ei+1 không tạo nên chu trình với i cạnh đã chọn trước đó có độ phức tạp là O(n2). - Do p n(n 1)/2, thuật toán Kruskal có độ phức tạp là O(p2). ThS. Nguyễn Khắc Quốc 25
  26. 6.2. CÂY KHUNG VÀ BÀI TOÁN TÌM CÂY KHUNG NHỎ NHẤT (tt). 6.2.4. Thuật toán Prim: - Kruskal làm việc kém hiệu quả đối với những đồ thị dày (đồ thị có số cạnh m n(n 1)/2). - Prim tỏ ra hiệu quả hơn. - Thuật toán Prim còn được gọi là phương pháp lân cận gần nhất. 1. VT:={v*}, trong đó v* là đỉnh tuỳ ý của đồ thị G. ET:=. 2. Với mỗi đỉnh vj VT, tìm đỉnh wj VT sao cho m(wj,vj) = min m(xi, vj):=j xi VT và gán cho đỉnh vj nhãn [wj, j]. - Nếu không tìm đuợc wj như vậy (tức là khi vj không kề với bất cứ đỉnh nào trong VT) thì gán cho vj nhãn [0, ]. ThS. Nguyễn Khắc Quốc 26
  27. 6.2. CÂY KHUNG VÀ BÀI TOÁN TÌM CÂY KHUNG NHỎ NHẤT (tt). 3. Chọn đỉnh vj* sao cho j* = min j vj VT VT := VT  {vj*}, ET := ET  {(wj*, vj*)}. - Nếu |VT| = n thì thuật toán dừng và (VT, ET) là cây khung nhỏ nhất. - Nếu |VT| m(vj*, vj) thì đặt j:=m(vj*, vj) và nhãn của vj là [vj*, j]. - Ngược lại, ta giữ nguyên nhãn của vj. - Sau đó quay lại Bước 3. ThS. Nguyễn Khắc Quốc 27
  28. 6.2. CÂY KHUNG VÀ BÀI TOÁN TÌM CÂY KHUNG NHỎ NHẤT (tt). Thí dụ: Tìm cây khung nhỏ nhất bằng thuật toán Prim của đồ thị gồm các đỉnh A, B, C, D, E, F, H, I được cho bởi ma trận trọng số sau. Yêu cầu viết các kết quả trung gian trong từng bước lặp, kết quả cuối cùng cần đưa ra tập cạnh và độ dài của cây khung nhỏ nhất. ThS. Nguyễn Khắc Quốc 28
  29. 6.2. CÂY KHUNG VÀ BÀI TOÁN TÌM CÂY KHUNG NHỎ NHẤT (tt). Vậy độ dài cây khung nhỏ nhất là: 15 + 12 + 11 + 13 + 14 + 17 + 21 = 103. ThS. Nguyễn Khắc Quốc 29
  30. 6.2. CÂY KHUNG VÀ BÀI TOÁN TÌM CÂY KHUNG NHỎ NHẤT (tt). Tính đúng đắn của thuật toán: - Chứng minh bằng quy nạp rằng T(k) (k=1, 2, ,n), đồ thị nhận được trong vòng lặp thứ k, là một đồ thị con của cây khung nhỏ nhất của G, do đó T(n) chính là một cây khung nhỏ nhất của G. - T(1) chỉ gồm đỉnh v* của G, do đó T(1) là đồ thị con của mọi cây khung của G. - Giả sử T(i) (1 i<n) là một đồ thị con của một cây khung nhỏ nhất của G. - Ta chứng minh rằng T(i+1) cũng là đồ thị con của một cây khung nhỏ nhất. - Thật vậy, theo thuật toán Prim ET(i+1)=ET(i)  {ei+1}, với ei+1 là cạnh ngắn nhất trong tất cả các cạnh có một đầu mút thuộc VT(i), đầu mút kia không thuộc VT(i). ThS. Nguyễn Khắc Quốc 30
  31. 6.2. CÂY KHUNG VÀ BÀI TOÁN TÌM CÂY KHUNG NHỎ NHẤT (tt). - Nếu ei+1 là một cạnh của T thì Ti+1 là đồ thị con của T. - Nếu ei+1 không phải là một cạnh của T thì Ti+1 là đồ thị con T’=(VT, ET{ei+1}). - Đồ thị T’ chứa một chu trình sơ cấp duy nhất C (theo tính chất 6 của định lý về cây). - Ta chọn trong C một cạnh ej có một đỉnh thuộc T(i) và đỉnh kia không thuộc T(i) và ej ei+1. - Ta bỏ ej trong C. - Khi đó T’’=(VT, ET’ \ {ej}) là một cây khung của G và T(i+1) là đồ thị con của T’ nên cũng là đồ thị con của T’’. - Theo cách chọn ei+1 của thuật toán Prim, ta có: m(ei+1) m(ej) do đó m(T’’) m(T). ThS. Nguyễn Khắc Quốc 31
  32. 6.2. CÂY KHUNG VÀ BÀI TOÁN TÌM CÂY KHUNG NHỎ NHẤT (tt). Nhưng T’’ là một cây khung của G, còn T là cây khung nhỏ nhất, vì vậy phải có m(T’’)=m(T), tức là T’’ cũng là cây khung nhỏ nhất của G. Độ phức tạp của thuật toán Prim: - Thật vậy, nếu T(k) có k đỉnh thì có n k đỉnh không thuộc T(k), do đó ta phải chọn chiều dài nhỏ nhất của nhiều nhất là k(n k) cạnh. - Do k(n k) < (n 1)2, nên độ phức tạp của bước chọn 2 ek+1 là O(n ). - Vì phải chọn n 1 cạnh, nên độ phức tạp của thuật toán Prim là O(n3). ThS. Nguyễn Khắc Quốc 32
  33. 6.3. CÂY CÓ GỐC. 6.3.1. Định nghĩa: - Cây có hướng là đồ thị có hướng mà đồ thị vô hướng nền của nó là một cây. - Cây có gốc là một cây có hướng, trong đó có một đỉnh đặc biệt, gọi là gốc, từ gốc có đường đi đến mọi đỉnh khác của cây. ThS. Nguyễn Khắc Quốc 33
  34. 6.3. CÂY CÓ GỐC (tt). Thí dụ: Trong cây có gốc thì: + Gốc r có bậc vào bằng 0, + Tất cả các đỉnh khác đều có bậc vào bằng 1. ThS. Nguyễn Khắc Quốc 34
  35. 6.3. CÂY CÓ GỐC (tt). - Một cây có gốc thường được vẽ với gốc r ở trên cùng và cây phát triển từ trên xuống, gốc r gọi là đỉnh mức 0. - Các đỉnh kề với r được xếp ở phía dưới và gọi là đỉnh mức 1. - Đỉnh ngay dưới đỉnh mức 1 là đỉnh mức 2, - Tổng quát, trong một cây có gốc thì v là đỉnh mức k khi và chỉ khi đường đi từ r đến v có độ dài bằng k. - Mức lớn nhất của một đỉnh bất kỳ trong cây gọi là chiều cao của cây. ThS. Nguyễn Khắc Quốc 35
  36. 6.3. CÂY CÓ GỐC (tt). Cây trên có thể vẽ lại để làm rõ mức của các đỉnh. Trong cây có gốc, mọi cung đều có hướng từ trên xuống, vì vậy vẽ mũi tên để chỉ hướng đi là không cần thiết; do đó, người ta thường vẽ các cây có gốc như là cây nền của nó. ThS. Nguyễn Khắc Quốc 36
  37. 6.3. CÂY CÓ GỐC (tt). 6.3.2. Định nghĩa: - Cho cây T có gốc r=v0. - Giả sử v0, v1, , vn-1, vn là một đường đi trong T. - Ta gọi: vi+1 là con của vi và vi là cha của vi+1. v0, v1, , vn-1 là các tổ tiên của vn vn là dòng dõi của v0, v1, , vn-1. Đỉnh treo vn là đỉnh không có con; Đỉnh treo cũng gọi là lá hay đỉnh ngoài; Đỉnh không phải lá là một đỉnh trong. ThS. Nguyễn Khắc Quốc 37
  38. 6.3. CÂY CÓ GỐC (tt). 6.3.3. Định nghĩa: - Một cây có gốc T được gọi là cây m-phân nếu mỗi đỉnh của T có nhiều nhất là m con. - Với m=2, ta có một cây nhị phân. - Trong một cây nhị phân, mỗi con được chỉ rõ là con bên trái hay con bên phải; con bên trái (hoặc phải) được vẽ phía dưới và bên trái (hoặc phải) của cha. - Cây có gốc T được gọi là một cây m-phân đầy đủ nếu mỗi đỉnh trong của T đều có m con. ThS. Nguyễn Khắc Quốc 38
  39. 6.3. CÂY CÓ GỐC (tt). 6.3.4. Mệnh đề: - Một cây m-phân đầy đủ có i đỉnh trong thì có mi+1 đỉnh và có (m 1)i+1 lá. Chứng minh: - Mọi đỉnh trong của cây m-phân đầy đủ đều có bậc ra là m, còn lá có bậc ra là 0, - Vậy số cung của cây này là mi và do đó số đỉnh của cây là mi+1. - Gọi l là số lá thì ta có l+i=mi+1, nên l=(m 1)i+1. ThS. Nguyễn Khắc Quốc 39
  40. 6.3. CÂY CÓ GỐC (tt). 6.3.5. Mệnh đề: 1) Một cây m-phân có chiều cao h thì có nhiều nhất là mh lá. 2) Một cây m-phân có l lá thì có chiều cao h [logml]. Chứng minh: 1) Mệnh đề được chứng minh bằng quy nạp theo h. - Mệnh đề hiển nhiên đúng khi h=1. - Giả sử mọi cây có chiều cao k h 1 đều có nhiều nhất mk-1 lá (với h 2). - Xét cây T có chiều cao h. - Bỏ gốc khỏi cây ta được một rừng gồm không quá m cây con, mỗi cây con này có chiều cao h 1. - Do giả thiết quy nạp, mỗi cây con này có nhiều nhất là mh-1 lá. - Do lá của những cây con này cũng là lá của T, nên T có nhiều nhất là m.mh-1=mh lá. h 2) l m h [logml]. ThS. Nguyễn Khắc Quốc 40
  41. 6.4. DUYỆT CÂY NHỊ PHÂN. 6.4.1. Định nghĩa: -Nhiều trường hợp, ta cần phải “điểm danh” hay “thăm” một cách có hệ thống mọi đỉnh của một cây nhị phân, mỗi đỉnh chỉ một lần. Ta gọi đó là việc duyệt cây nhị phân hay đọc cây nhị phân. - Cây nhị phân T có gốc r được ký hiệu là T(r). - Giả sử r có con bên trái là u, con bên phải là v. - Cây có gốc u và các đỉnh khác là mọi dòng dõi của u trong T gọi là cây con bên trái của T, ký hiệu T(u). - Tương tự, ta có cây con bên phải T(v) của T. - Một cây T(r) có thể không có cây con bên trái hay bên phải. ThS. Nguyễn Khắc Quốc 41
  42. 6.4. DUYỆT CÂY NHỊ PHÂN (tt). Thuật toán tiền thứ tự: 1. Thăm gốc r. 2. Duyệt cây con bên trái của T(r) theo tiền thứ tự. 3. Duyệt cây con bên phải của T(r) theo tiền thứ tự. ThS. Nguyễn Khắc Quốc 42
  43. 6.4. DUYỆT CÂY NHỊ PHÂN (tt). Thí dụ: - Thăm a - Duyệt T(b) Thăm b - Duyệt T(d) Thăm d - Duyệt T(g) Thăm g - Duyệt T(l) Thăm l - Duyệt T(h) Thăm h - Duyệt T(e) Thăm e - Duyệt T(i) Thăm i - Duyệt T(m) Thăm m - Duyệt T(n) Thăm n - Duyệt T(c) Thăm c - Duyệt T(f) Thăm f - Duyệt T(j) Thăm j Kết quả duyệt cây T(a) theo tiền thứ tự là: - Duyệt T(o) Thăm o - Duyệt T(p) Thăm p a, b, d, g, l, h, e, i, m, n, c, f, j, o, p, k, q, s. - Duyệt T(k) Thăm k - Duyệt T(q) Thăm q - Duyệt T(s) Thăm s ThS. Nguyễn Khắc Quốc 43
  44. 6.4. DUYỆT CÂY NHỊ PHÂN (tt). Thuật toán trung thứ tự: 1. Duyệt cây con bên trái của T(r) theo trung thứ tự. 2. Thăm gốc r. 3. Duyệt cây con bên phải của T(r) theo trung thứ tự. ThS. Nguyễn Khắc Quốc 44
  45. 6.4. DUYỆT CÂY NHỊ PHÂN (tt). Thí dụ: - Duyệt T(b); - Duyệt T(d) - Duyệt T(g) - Thăm g - Duyệt T(l) - Thăm l - Thăm d - Duyệt T(h) - Thăm h - Thăm b - Duyệt T(e); - Duyệt T(i) - Duyệt T(m) - Thăm m - Thăm i - Duyệt T(n) - Thăm n - Thăm e - Thăm a - Duyệt T(c) - Thăm c - Duyệt T(f); - Duyệt T(j) - Duyệt T(o) - Thăm o - Thăm j Kết quả duyệt cây T(a) theo trung thứ tự là: - Duyệt T(p) - Thăm p g, l, d, h, b, m, i, n, e, a, c, o, j, p, f, q, k, s. - Thăm f - Duyệt T(k);- Duyệt T(q) -Thăm q; - Thăm k - Duyệt T(s) - Thăm s ThS. Nguyễn Khắc Quốc 45
  46. 6.4. DUYỆT CÂY NHỊ PHÂN (tt). Thuật toán hậu thứ tự: 1. Duyệt cây con bên trái của T(r) theo hậu thứ tự. 2. Duyệt cây con bên phải của T(r) theo hậu thứ tự. 3. Thăm gốc r. ThS. Nguyễn Khắc Quốc 46
  47. 6.4. DUYỆT CÂY NHỊ PHÂN (tt). Thí dụ: - Duyệt T(b); - Duyệt T(d) - Duyệt T(g); - Duyệt T(l) - Thăm l; Thăm g - Duyệt T(h) - Tthăm h - Thăm d - Duyệt T(e); - Duyệt T(i) - Duyệt T(m) - Thăm m - Duyệt T(n) - Thăm n - Thăm I;- Thăm e - Thăm b - Duyệt T(c); - Duyệt T(f) - Duyệt T(j); - Duyệt T(o): - Thăm o - Duyệt T(p) - Thăm p - Thăm j Kết quả duyệt cây T(a) theo trung thứ tự là: - Duyệt T(k) - Duyệt T(q) l, g, h, d, m, n, i, e, b, o, p, j, q, s, k, f, c, a. - Thăm q - Duyệt T(s): Thăm s - Thăm k; - Thăm f - Thăm c - Thăm a ThS. Nguyễn Khắc Quốc 47
  48. 6.4. DUYỆT CÂY NHỊ PHÂN (tt). 6.4.3. Ký pháp Ba Lan: Xét biểu thức đại số - Ta vẽ một cây nhị phân - Trong đó mỗi đỉnh trong mang dấu của một phép tính trong (1), - Gốc của cây mang phép tính sau cùng trong (1), - Gốc mang dấu (*), mỗi lá mang một số hoặc một chữ đại diện cho số. ThS. Nguyễn Khắc Quốc 48
  49. 6.4. DUYỆT CÂY NHỊ PHÂN (tt). - Duyệt cây nhị phân trên theo trung thứ tự là: a + b c d / 2 (2) - Ta nói rằng biểu thức (1) được biểu diễn bằng cây nhị phân T() trong hình trên, hay cây nhị phân T() này tương ứng với biểu thức (1). - Ta cũng nói: cách viết (ký pháp) quen thuộc trong đại số học như cách viết biểu thức (1) là ký pháp trung thứ tự kèm theo các dấu ngoặc. ThS. Nguyễn Khắc Quốc 49
  50. 6.4. DUYỆT CÂY NHỊ PHÂN (tt). - Ta biết rằng các dấu ngoặc trong (1) là rất cần thiết, vì (2) có thể hiểu theo nhiều cách khác (1), chẳng hạn là (a + b c) d / 2 (3) hoặc là a + (b c d) / 2 (4) - Các biểu thức (3) và (4) có thể biểu diễn bằng cây nhị phân trong các hình sau. - Hai cây nhị phân tương ứng là khác nhau, nhưng đều được duyệt theo trung thứ tự là (2). ThS. Nguyễn Khắc Quốc 50
  51. 6.4. DUYỆT CÂY NHỊ PHÂN (tt). Duyệt theo tiền thứ tự: *+ a b c / d 2 (5) Duyệt theo hậu thứ tự: a b + c d 2 / * (6) Duyệt theo tiền thứ tự: + *a b c / d 2 khác với (5). Duyệt theo hậu thứ tự: a b c * + d 2 / khác với (6). ThS. Nguyễn Khắc Quốc 51
  52. 6.4. DUYỆT CÂY NHỊ PHÂN (tt). Vì vậy, nếu ta viết các biểu thức trong đại số, trong lôgic bằng cách duyệt cây tương ứng theo tiền thứ tự hoặc hậu thứ tự thì ta không cần dùng các dấu ngoặc mà không sợ hiểu nhầm. - Người ta gọi cách viết biểu thức theo tiền thứ tự là ký pháp Ba Lan, còn cách viết theo hậu thứ tự là ký pháp Ba Lan đảo, để ghi nhớ đóng góp của nhà toán học và lôgic học Ba Lan Lukasiewicz (1878-1956) trong vấn đề này. - Việc chuyển một biểu thức viết theo ký pháp quen thuộc (có dấu ngoặc) sang dạng ký pháp Ba Lan hay ký pháp Ba Lan đảo hoặc ngược lại, có thể thực hiện bằng cách vẽ cây nhị phân tương ứng, như đã làm đối với biểu thức (1). Nhưng thay vì vẽ cây nhị phân, ta có thể xem xét để xác định dần các công thức bộ phận của công thức đã cho. ThS. Nguyễn Khắc Quốc 52
  53. 6.4. DUYỆT CÂY NHỊ PHÂN (tt). Chẳng hạn cho biểu thức viết theo ký pháp Ba Lan là  / a b 5 c 2 3  c d 2 a c d /  b 3 d 3 5 - Trước hết, chú ý rằng các phép toán +, , *, /,  đều là các phép toán hai ngôi, - Vì vậy trong cây nhị phân tương ứng, các đỉnh mang dấu các phép toán đều là đỉnh trong và có hai con. - Các chữ và số đều đặt ở lá. - Theo ký pháp Ba Lan (or Ba Lan đảo) thì T a b (or a b T) có nghĩa là a T b, với T là một trong các phép toán +, , *, /, . ThS. Nguyễn Khắc Quốc 53
  54. 6.4. DUYỆT CÂY NHỊ PHÂN (tt). ThS. Nguyễn Khắc Quốc 54
  55. 6.4. DUYỆT CÂY NHỊ PHÂN (tt). ThS. Nguyễn Khắc Quốc 55