Bài giảng Cơ sở dữ liệu GIS

pdf 71 trang huongle 2260
Bạn đang xem 20 trang mẫu của tài liệu "Bài giảng Cơ sở dữ liệu GIS", để tải tài liệu gốc về máy bạn click vào nút DOWNLOAD ở trên

Tài liệu đính kèm:

  • pdfbai_giang_pco_so_du_lieu_gis.pdf

Nội dung text: Bài giảng Cơ sở dữ liệu GIS

  1. Bài giảng CƠ SỞ DỮ LIỆU GIS
  2. KHÁI NIỆM VỀ CƠ SỞ DỮ LIỆU (CSDL)
  3. CSDL là gì ? Hệ Quản Trị CSDL là gì ? Các mơ hình CSDL ?
  4. CSDL là gì ? . Là sự tập hợp một hay nhiều file dữ liệu hay dữ liệu bảng được lưu trữ theo một kiểu cấu trúc. . Cĩ mối quan hệ bên trong giữa các thơng tin hay giữa các dữ liệu. . Được quản trị bằng phần mềm (DBMS) . Sử dụng phục vụ dữ liệu cho những yêu cầu dữ liệu khác nhau
  5. Mục đích: . Là phương pháp lưu trữ dữ liệu của các chương trình truy xuất dữ liệu . Điều khiển và chuẩn hĩa quá trình nhập và cập nhật dữ liệu . Bảo mật dữ liệu truy xuất . Cho phép đa người sử dụng trên những trường hay bảng dữ liệu xác định
  6. Nhân của hệ . điều khiển quá trình chất vấn (Query), truy xuất dữ liệu, lưu trữ, quản lý đa người dùng Liên kết . Giao tiếp ngơn ngữ chất vấn SQL (structured query language) . Hiển thị dữ liệu . Hệ thống quản lý các dạng màn hình . Điều khiển các menu . Các báo cáo và giao tiếp ngơn ngữ lập trình
  7. Mơ hình bảng (danh sách) Mơ hình quan hệ Mơ hình mạng Mơ hình phân nhánh Mơ hình hướng đối tượng
  8. Là “ một hiện tượng trong thực tế mà khơng được phân chia nhỏ ra thành những hiện tượng cùng loại” . Vd. Thành phố là một thực thể và được chia nhỏ ra thành các bộ phận hợp phần nhưng các phần này khơng được gọi là thành phố, chúng được gọi là quận. . Rừng cây phân chia thành các mảnh rừng nhỏ hơn.
  9. Là “ sự trình bày dạng số của tất cả hoặc một phần của thực thể” Các hiện tượng phụ thuộc vào tỷ lệ. . Vd. Một thành phố được trình bày như một điểm (point) nếu như diện tích nghiên cứu ở qui mơ lục địa. . Thành phố đĩ cĩ thể được trình bày như một vùng (area) nếu như diện tích nghiên cứu một quốc gia.
  10. Kiểu thực thể là nhĩm hiện tượng tương tự được thể hiện và lưu trữ cùng kiểu . Vd. đường giao thơng, sơng suối Xác định kiểu thực thể nhằm: . Giúp cho việc chồng xếp các nhĩm thơng tin. . Trợ giúp cho việc kiểm chứng nội dung của cơ sở dữ liệu.
  11. Là đặc điểm của thực thể biểu diễn Thường là phi khơng gian. Một số cĩ thể liên quan tới đặc điểm khơng gian . Vd. diện tích, chu vi
  12. Lớp trình bày một kiểu thực thể hoặc một nhĩm kiểu thực thể quan hệ . Vd. Lớp cĩ các đoạn sơng hoặc cĩ sơng, hồ, bờ biển. Một số CSDL khơng gian kết hợp các thực thể vào một lớp.
  13. Thế giới thực quá phức tạp trong những nhận thức trực tiếp Chúng ta tạo "model" thực tế với nỗ lực cĩ một số nét tương tự với thế giới thực Những CSDL (databases) được tạo ra từ những "models" như là những buớc cơ sở tiến tới hiểu biết về bản chất và trạng thái thế giới thực
  14. CSDL khơng gian (spatial database) là sự tập hợp dữ liệu cĩ tham chiếu khơng gian và nĩ là những mơ hình của thực tế. . CSDL khơng gian là một mơ hình của thực tế với ý nghĩa là CSDL biểu diễn cĩ lựa chọn các hiện tượng rất gần với thực tế . Những hiện tượng chọn lựa biểu diễn trong dạng số GIS kết hợp chặt chẽ DBMS truyền thống với nhiều tiện ích để quản lý hợp phần khơng gian và thuộc tính các dữ liệu địa lý.
  15. Ranh giới hành chính Tiện ích Phân vùng Nhà cửa Địa chính Thùy văn Đường xá Dữ liệu số
  16. Dữ liệu được tổ chức theo lớp. Mỗi lớp biểu diễn những yếu tố cĩ đặc điểm chung. Các lớp được tích hợp trong khơng gian thống nhất trên bề mặt Trái đất Vị trí địa lý là cơ sở tổ chức dữ liệu
  17. Mơ hình bảng (danh sách) Mơ hình quan hệ Mơ hình mạng Mơ hình phân nhánh Mơ hình hướng đối tượng
  18. Khơng cĩ cấp bậc của trường dữ liệu, mỗi trường dữ liệu được dùng như là key. Thuộc tính quan hệ được lưu trữ trong những bảng khác nhau Tìm kiếm thực hiện nối hai hoặc nhiều bảng dùng thuộc tính giống nhau. Hệ thống linh động và thích hợp cho việc sử dụng SQL.
  19. Dữ liệu được tổ chức theo cấu trúc hình cây. Cấp bậc cao nhất gọi là gốc Mơ hình cĩ lớp trên, lớp dưới. Mọi quan hệ là quan hệ nhiều – một hoặc quan hệ một – một. Truy tìm dữ liệu hiệu qủa nếu khơng cĩ nhiều cấp trung gian.
  20. MƠ HÌNH VÀ CẤU TRÚC DỮ LIỆU KHƠNG GIAN
  21. 1. Mơ hình dữ liệu (Spaghetti) . Đơn giản nhất. . Về bản chất là mơ hình vẽ bản đồ. . Điểm, đường, vùng và ký tự được biểu diễn đơn thuần là vị trí. . Khơng cĩ mơ tả rõ ràng quan hệ khơng gian. . Ranh giới chung giữa 2 polygon kề nhau được ghi 2 lần. . Khơng hữu hiệu trong phân tích khơng gian . Ưu điểm trong việc tái sản xuất bản đồ số mà khơng cần lưu trữ quan hệ khơng gian.
  22. 2. Mơ hình topology Cấu trúc topology cịn được gọi là cấu trúc cung-nút (arc- node) với phần tử cơ bản là cung. . Sử dụng mã hĩa các mối quan hệ khơng gian . Topology dùng để định nghĩa các quan hệ khơng gian. . Dữ liệu thuộc tính được lưu trữ trong các bảng quan hệ
  23. Trong cấu trúc này: - Nút là điểm giao nhau của hai hay nhiều cung, đối với những cung độc lập, nút là điểm cuối cùng của cung, khơng nối liền với bất kỳ cung nào khác. - Cung (arc) được mơ tả như là một chuỗi những đoạn thẳng nối liền nhau, điểm đầu và cuối gọi là nút (node), những điểm giữa cung gọi là đỉnh (vertex). - Vùng là một chuỗi những cung nối liền nhau và khép kín, những cung này chính là đường biên của vùng. Một vùng cĩ thể được giới hạn bởi hai đường cong khép kín lồng vào nhau và khơng cắt nhau.
  24. Các đối tượng địa lý trong cấu trúc topology được mơ tả trong bốn bảng: Ba bảng đầu lưu trữ các phần tử khơng gian vùng, nút, cung. Bảng thứ tư lưu trữ tọa độ nút, nút cuối và đỉnh.
  25. Các bảng Topology: - Bảng topology vùng - xác định những cung làm đường biên của vùng, phần bên ngồi bản đồ cũng được xem như một vùng khơng xác định cung đường biên. - Bảng topology nút - xác định mỗi nút thuộc những cung nào. - Bảng topology cung - xác định quan hệ của nút và vùng với cung. - Bảng dữ liệu tọa độ - lưu trữ tọa độ của các cung bằng cách lưu trữ tọa độ của các nút và đỉnh của cung, để từ đĩ vị trí của mỗi phần tử trên bản đồ được liên hệ với thế giới thực.
  26. Các bảng Topology: - Bảng topology vùng - xác định những cung làm đường biên của vùng, phần bên ngồi bản đồ cũng được xem như một vùng khơng xác định cung đường biên. - Bảng topology nút - xác định mỗi nút thuộc những cung nào. - Bảng topology cung - xác định quan hệ của nút và vùng với cung. - Bảng dữ liệu tọa độ - lưu trữ tọa độ của các cung bằng cách lưu trữ tọa độ của các nút và đỉnh của cung, để từ đĩ vị trí của mỗi phần tử trên bản đồ được liên hệ với thế giới thực.
  27. 70 a3 N1 a1 60 50 N2 A a3 E 40 N4 a5 30 B N3 a7 20 D,a6,N5 a7 C a7 a2 a2 a7 N6 10 a2 0 0 10 20 30 40 50 60 70
  28. Topology cung Topology vùng Cung Nút đầu Nút cuối Vùng trái Vùng phải Vùng Cung a1 N1 N2 E A A a1, a5, a3 a2 N2 N3 E B B a2, a5, 0, a6, 0, a3 N3 N1 E A C a7 a4 N4 N1 A A D a7 a5 N3 N2 A B E a6 a6 N5 N5 B D vùng ngoài a7 N6 N6 B C Dữ liệu toạ độ cung Topology nút Nút Cung Cung Nút đầu Đỉnh (vertex) Nút cuối (x,y) (x,y) (x,y) N1 a1, a3, a4 N2 a1, a2, a5 a1 40,60 70,60 70,50 a2 70,50 70,10;10,10 10,25 N3 a2, a3, a5 N4 a4 a3 10,25 10,60 40,60 a4 40,60 30,50 30,40 N5 a6 N6 a7 a5 10,25 20,27;30,30;50,32 70,50 a6 30,20 55,15;40,15;45,27 30,20 a7 55,27 55,27
  29. Bài tập 1. Xây dựng dữ liệu cung (dữ liệu tọa độ cung) và các bảng cung – nút – vùng cho mơ hình dữ liệu khơng gian sau:
  30. Bài tập2. Cho bảng dữ liệu tọa độ cung sau: Điểm đầu Đỉnh Điểm cuối Cung (Arc) (From node) (Verties) (To node) a 2,5 2,8 5,8 b 5,8 8,8 8,5 c 8,5 8,1; 2,1 2,5 d 5,8 5,5 8,5 e 4,3 4,2; 3,2; 3,3 4,3 f 2,5 3,5 4,6 a. Hãy xây dựng mơ hình dữ liệu khơng gian của bảng dữ liệu tọa độ trên b. Hãy xây dựng các bảng Topology vùng, Topology nút, Topolygy cung.
  31. Yêu cầu: 1. Thống nhất trong các ký hiệu khi làm bài: - Điểm (node): N1, N2, N3, . - Cung (arc): a,b,c, - Vùng (polygon): A, B, C, 2. Thể hiện chiều mũi tên từ điểm đầu đến điểm cuối trên các cung của mơ hình cơ sở dữ liệu khơng gian (hình vẽ).
  32.  Ưu điểm Các bảng Topology cung, nút, vùng cho phép phân tích các quan hệ giữa các phần tử trên bản đồ mà khộng cần đến dữ liệu tọa độ. Do đĩ, cấu trúc topology rất thích hợp với những tốn tử phân tích khơng gian, nhất là những bài tốn kề (contiguity) và kết nối (connectivity).  Nhược điểm Phần lớn dữ liệu nhập vào GIS khơng tồn tại ở dạng cấu trúc dữ liệu topology, việc xây dựng topology bởi phần mềm GIS cĩ thể tốn thời gian và sử dụng nhiều nguồn lực máy tính. Mỗi khi cĩ sự biên tập tác động đến dữ liệu hình học, topology phải xây dựng lại.
  33. Các mối quan hệ Topology giữa các đối tượng khơng gian
  34. Các mối quan hệ Topology giữa các đối tượng khơng gian Quan hệ điểm-điểm - “Trong giới hạn (is within)”: Nằm trong giới hạn một khoảng cách cụ thể. - “Gần nhất với (is nearest to)”: Gần nhất so với một điểm cụ thể. Quan hệ điểm-đường - “ Nằm trên đường (on line)”: điểm nằm trên một đường. - “ Gần nhất với (is nearest to)”: Điểm gần nhất so với một đường. Quan hệ điểm-vùng - “Chứa bên trong vùng (is contained in)”: Điểm chứa bên trong vùng. - “Nằm trên biên (on border of area)”: Một điểm nằm trên đường biên của vùng.
  35. Các mối quan hệ Topology giữa các đối tượng khơng gian Quan hệ đường-đường - “Giao nhau (intersects)”: Hai đường giao nhau. - “Băng qua (crosses)”: Hai đường băng qua mà khơng giao nhau. - “Chảy vào (flow into)”: Một nhánh sơng chảy vào một dịng sơng. Quan hệ đường-vùng - “Giao nhau (intersects)”: Một đường giao (cắt) với một vùng. - “Đường biên (borders)”: Đường là một phần biên của vùng. Quan hệ vùng-vùng - “Chồng lớp (overlaps)”: Hai vùng chồng lên nhau. - “Nằm bên trong (is within)”: Một vùng nằm bên trong một vùng khác. - “Kế cận (is adjacent to)”: Hai vùng cùng cĩ một đường biên chung
  36. Dữ liệu raster được tạo thành bằng cách chồng lưới các ơ lên trên các đối tượng địa lý. Giá trị ơ chính là giá trị đo hoặc ghi 1 5 Bản đồ gốc nhận được của đối tượng nằm đầy 6 7 trong ơ. Trong trường hợp đối tượng khơng nằm đầy ơ, giá trị ơ được gán theo các nguyên tắc: Lưới chồng lớp (grid overlay) - Đối tượng chiếm đa số về diện tích - Đối tượng tại tâm ơ Dòng - Đối tượng chạm ơ – đối với đối 1 2 3 4 5 6 7 8 9 10 1 1 1 1 1 1 5 5 5 5 5 2 1 1 1 1 1 5 5 5 5 5 tượng đường Cột 3 1 1 1 1 6 6 5 5 5 5 4 1 1 1 1 6 6 5 5 5 5 - hoặc chọn theo trọng số để đảm bảo 5 6 6 6 6 6 6 7 7 7 7 Bản đồ dạng ô lưới 6 6 6 6 6 6 7 7 7 7 7 các đối tượng cĩ đặc tính quý hiếm 7 6 6 6 6 7 7 7 7 7 7 8 6 6 6 6 7 7 7 7 7 7 được biểu diễn
  37. Giá trị của ơ cĩ thể là chữ hoặc là số tùy theo đối tượng được biểu diễn. Giá trị trong “ơ lưới” tương ứng với đặc tính của hiện tượng trong khơng gian tại vị trí ơ. Sự thay đổi của giá trị phản ánh sự thay đổi của hiện tượng. Một ơ đơn được gán chỉ 1 giá trị, do vậy để cĩ thể biểu diễn nhiều đặc tính của cùng 1 đối tượng, 1 hệ thống các lớp dữ liệu raster được sủ dụng. Mỗi lớp raster thể hiện 1 loại đặc tính. Lưới ơ thường cĩ gốc tọa độ bắt đầu tại vị trí trên trái. Vị trí hình học của các ơ được xác định bởi số hàng và số cột.
  38. Dữ liệu raster cĩ thể đến từ ảnh viễn thám, ảnh chụp máy bay, hoặc raster hĩa từ nguồn dữ liệu vector
  39. Các đối tượng điểm, đường vùng trong mơ hình Raster được biểu diễn như sau:  Đối tượng điểm được biểu diễn bằng các điểm ảnh đơn.  Đối tượng đường được biểu diễn bằng một chuỗi các điểm ảnh liên tục và cĩ độ rộng khơng đều, cĩ đường biên zic-zac tùy kích thước của điểm ảnh.  Đối tượng vùng được biểu diễn bằng 1 mảng các điểm ảnh liên tục.
  40.  Độ phân giải khơng gian của mơ hình Raster là kích thước của một pixel trên mặt đất. Một ơ 10m thể hiện bề mặt diện tích 10x10 = 100m2. Một ơ 30m thể hiện bề mặt diện tích là 900m2. Như vậy ơ 10m cĩ độ phân giải khơng gian tốt hơn ơ 30m.  Kích thước ơ lớn khơng thể biểu diễn chính xác vị trí của các đối tượng khơng gian do cĩ nhiều đối tượng khơng gian cùng tồn tại trong 1 ơ.  Kích thước ơ nhỏ cĩ thể biểu diễn chính xác vị trí của các đối tượng khơng gian sẽ làm tăng dung lượng lưu trữ và thời gian xử lý dữ liệu.
  41.  Dung lượng lưu trữ của mơ hình raster theo độ phân giải Ví dụ: Với độ phân giải 100m, một vùng vuơng 100km cần một raster cĩ 1000 hàng và 1000 cột tương ứng với 1 triệu pixel, nếu dùng 1byte để biểu diễn 1 pixel thì dung lượng cần thiết là 0,96MB. và để cĩ độ phân giải 10m thì cần 100triệu pixel, khoảng 96 MB.  Mơ hình Raster thường được biểu diễn với các cấu trúc cĩ sử dụng các phương pháp nén dữ liệu để giảm bớt dung lương lưu trữ.
  42.  Trong cấu trúc raster, đường được biểu diễn bằng những pixel cĩ cùng giá trị f(x,y) liên tiếp nhau. Vì trong cấu trúc raster, các pixel được xếp theo hàng, cột như một ma trận điểm nên đường ở đây khơng trơn mà cĩ dạng zic-zac.  Vùng được xác định bằng một mảng gồm nhiều điểm ảnh cĩ cùng giá trị thuộc tính f(x,y) trải rộng ra theo nhiều phương.
  43. Đối tượng điểm (point objects) Mỗi đối tượng điểm là một điểm ảnh được gán ID điểm, toạ độ (i, j) và các thuộc tính. Số pixel i Số hàng j (i,j) = (5,3);(7,5);(8,2)
  44. Đối tượng đường (line objects) Mỗi đối tượng đường được gán ID đường, chuỗi tọa độ định dạng đường và các thuộc tính. (1,3);(2,2);(3,2) ;(4,3); (5,4) ;(6,5) ;(7,5) ;(8,4)
  45. Đối tượng vùng (polygon objects) - Mỗi đối tượng vùng được gán ID vùng, nhĩm tọa độ định dạng vùng và thuộc tính.
  46.  Mã hĩa từng ơ Là phương pháp mã hĩa đơn giản nhất. Một lưới Raster được lưu trữ như 1 ma trận và giá trị ơ được ghi vào một tập tin theo hàng và theo cột. Phương pháp này áp dụng rất tốt trong trường hợp giá trị ơ biến thiên liên tục. Mơ hình độ cao số DEM sử dụng phương pháp này để lưu trữ bởi vì giá trị độ cao của các ơ lân cận ít khi nào giống nhau. ảnh vệ tinh cũng sử dụng phương pháp này để lưu trữ.
  47.  Mã hĩa đoạn chạy – Run length - Mã run - length lợi dụng sự giống nhau của các pixel lân cận để biểu diễn chúng từng loạt pixel cĩ giá trị giống nhau theo từng hàng từ trái qua phải, từ trên xuống dưới. - Mỗi loạt pixel cĩ giá trị giống nhau được biểu diễn bằng một cặp số (chiều dài chuỗi, giá trị của pixel). - Mã này rất hữu hiệu khi thuộc tính của lớp dữ liệu ảnh (giá trị của pixel) ít thay đổi. Ngược lại, nếu giá trị thuộc tính thay đổi nhiều, đơi khi việc dùng mã này cịn làm tăng dung lượng dữ liệu.
  48. 0 1 2 3 4 5 6 7 8 9 Hướng đọc các pixel theo mã run-length 0 A A A A A A A A A A 1 A A A A A A A A A A 2 A A A A B B B B B B 3 A A A B B B B B B B 4 D D D D B B B B B B Biểu diễn mã run-length 5 D D D D D B B B B B của lớp dữ liệu ảnh raster hình bên: (10,A) (10,A) 6 D D D D D CD CD CD CD CD (4,A) (6,B) (3,A) (7,B) 7 D D D D D CD CD CD CD CD (4,D) (6,B) (5,D) (5,B) 8 D D D D D CD CD CD CD CD (5,D) (5,C) (5,D) (5,C) (5,D) (5,C) (5,D) 9 D D D D D CD CD CD CD CD (5,C).
  49. - Mã run-length tuy cĩ thuật tốn nén và giải mã đơn giản nhưng tỉ số nén khơng cao, - Thao tác tìm kiếm thường chậm vì lưu trữ theo hàng khơng lưu ý tới tính lân cận. - Để khắc phục tình trạng này, mã run-length được cải biên theo những đường đọc dữ liệu khác nhau.
  50. Mã hĩa run length cải biên 0 1 2 3 4 5 6 7 8 9 0 A A A A A A A A A A 1 A A A A A A A A A A 2 A A A A B B B B B B 3 A A A B B B B B B B 4 D D D D B B B B B B 5 D D D D D B B B B B (24,A) (13,B) (3,A) 6 D D D D D CD CD CD CD CD (13,B) (4,D) (11,B) 7 D D D D D CD CD CD CD CD (10,D) (10,C) (10,D) 8 D D D D D CD CD CD CD CD (10,C) (5,D). 9 D D D D D CD CD CD CD CD
  51. Mã hĩa phần tư – cây tứ phân - Mã tứ phân cũng dựa theo nguyên lý sự giống nhau của nhiều pixel trong những vùng cĩ cùng thuộc tính. - Mỗi vùng chỉ cần gán một giá trị. - Vùng được xác định bằng cách chia nhỏ diện tích làm 4 phần bằng nhau, mỗi phần lại được chia nhỏ thành 4 phần, v.v - Việc chia nhỏ này sẽ khơng thực hiện ở những vùng cĩ cùng thuộc tính.
  52. Mã hĩa phần tư – cây tứ phân Bản đồ 0 1 0 1 2 3 0 1 0 1 2 3 2 3 3 2 310 311 312 313
  53. Mã hĩa phần tư – cây tứ phân Bảng thuộc tính Mức của cây Thuộc tính 1 2 3 0 Công nghiệp 1 Công nghiệp 2 Nông thôn 3 0 Nhà ở 1 0 Dịch vụ thương mại 1 Dịch vụ thương mại 2 Dịch vụ công cộng 3 Khu giải trí 2 Biệt thự 3 Biệt thự
  54. Mã hĩa phần tư – cây tứ phân Các thành phần của cây tứ phân - Gốc: từ đĩ các nhánh khác được mở rộng - Lá là điểm mà từ đĩ quá trình phân nhánh khơng xảy ra - Tất cả các điểm cịn lại trong cây gọi là nút Nhiều hệ thống đánh mã đã được phát triển để chỉ định mã nhận dạng đến các nút, trong đĩ cĩ hệ thống đánh mã Morton. Mã chỉ định cho mỗi nút là sự kết hợp của nút ở cấp độ cao hơn và mã ở cấp độ hiện hành. VD nút 212 là sự kết hợp của mã 21 ở cấp độ trên và mã 2 ở cấp độ hiện hành. Hệ thống đánh mã này cĩ ưu điểm là lân cận của mỗi nút cĩ thể được tìm ra từ hệ thống đánh mã. VD lân cận của nút 212 là các nút 21x(0, 1, 3) và các nút 2x(20, 21, 22, 23).
  55. Mã hĩa phần tư – cây tứ phân Ưu điểm: cho phép tổng quát hĩa dữ liệu đến mức độ chi tiết tùy chọn. Hạn chế: tốn nhiều thời gian cho việc tạo ra và hiệu chỉnh. Khi bản đồ trở nên phức tạp và dữ liệu phải cập nhật thường xuyên thì tính hiệu quả trong lưu trữ sẽ mất đi.
  56. Bài tập 1. Cho mơ hình dữ liệu khơng gian sau: 0 1 2 3 4 5 6 7 0 CS CS CS CS CS CS CS CS 1 CS CS CS CS CS CS CS CS 2 CS CS Đ Đ Đ AT AT AT 3 CS CS Đ Đ Đ AT AT AT 4 CS CS Đ Đ Đ Đ Đ Đ 5 Đ Đ Đ Đ Đ Đ Đ Đ 6 Đ Đ Đ T T T CS CS 7 Đ Đ T T T T CS CS Ghi chú: CS – cao su, Đ – điều, T – tiêu, AT – ăn trái Hãy mã hĩa lớp dữ liệu khơng gian trên theo: a. phương pháp mã hĩa đoạn chạy b. phương pháp mã hĩa đoạn chạy cải tiến c. phương pháp mã hĩa phần tư
  57. Bài tập 2. Cho mơ hình dữ liệu khơng gian sau: 0 1 2 3 4 5 6 7 0 M M M M M M M M 1 M M M M M M M M 2 P PS PS PS M M P P 3 P PS PS PS M M P P 4 P X M Đ M M P P 5 P PS P Đ Đ Đ P P 6 X X M M P P X M 7 X X M M P P X X Ghi chú: M – Đất mặn, P – đất phèn, PS – đất phù sa, X – đất xám Hãy mã hĩa lớp dữ liệu khơng gian trên theo: a. phương pháp mã hĩa đoạn chạy b. phương pháp mã hĩa đoạn chạy cải tiến c. phương pháp mã hĩa phần tư
  58. Chỉ những hiện tượng quan trọng thu thập biểu diễn trong CSDL. . Vd: Con đường cĩ bề dày, nhưng khơng quan trọng bằng chiều rộng và dài Xác định rõ hiện tượng, đối tượng và chọn dữ liệu thích hợp biểu diễn chúng là một phần của quá trình thiết kế CSDL . Vd: trên bản đồ 1:100.000 những ngơi nhà khơng phân biệt Mục đích đảm bảo dữ liệu được nhận dạng và mơ tả trong tính tồn vẹn chính xác. Kiểu cách, hình thức được người phân tích dữ liệu chấp nhận
  59. Mục tiêu: . Nhận biết, nhận diện nội dung CSDL và mơ tả nĩ trong dạng tĩm tắt, hay khái niệm Xác định mục tiêu CSDL . Cần làm gì ? . Làm sao sẽ thực hiện được ? . Trên cơ sở đĩ, xác định tất cả các dạng nhu cầu về dữ liệu nhằm thực hiện mục tiêu nĩi trên.
  60. Đặc điểm . Phần cứng và phần mềm khơng lệ thuộc . Những mơ tả & định nghĩa các thực thể . Xác định thực thể biểu diễn trong CSDL ▪ Vd. chọn các đối tượng khơng gian - points, lines, areas, raster cells . Những yêu cầu qui mơ biểu diễn & những mối quan hệ sẽ biểu diễn ▪ Dựa trên cơ sở quá trình xử lý trên các đối tượng ▪ Vd. Cần biểu diễn tịa nhà như diện tích hay point? ▪ Vd. nên chia nhỏ đường giao thơng như thế nào để liên kết trong CSDL?
  61. Mục tiêu . CSDL được mơ tả chi tiết, bao gồm các hạng mục tin, các mối quan hệ dữ liệu, độ chính xác, các thủ tục đảm bảo sự tồn vẹn dữ liệu . Phần mềm cần xác định nhưng phần cứng khơng lệ thuộc . Thiết đặt cấu trúc logic các yếu tố CSDL, Xác định bởi hệ quản trị dữ liệu-DBMS sử dụng bởi phần mềm
  62. Đặc điểm . Cả phần cứng & mềm đều yêu cầu. . Yêu cầu tổ chức file trên máy tính . Triển khai kết quả của mức logic trên các phần cứng, phần mềm cụ thể.