Giáo trình Bản đồ học và GIS - Phần 2: Hệ thống thông tin địa lý (GIS)
Bạn đang xem 20 trang mẫu của tài liệu "Giáo trình Bản đồ học và GIS - Phần 2: Hệ thống thông tin địa lý (GIS)", để tải tài liệu gốc về máy bạn click vào nút DOWNLOAD ở trên
Tài liệu đính kèm:
- giao_trinh_ban_do_hoc_va_gis_phan_2_he_thong_thong_tin_dia_l.pdf
Nội dung text: Giáo trình Bản đồ học và GIS - Phần 2: Hệ thống thông tin địa lý (GIS)
- PHẦN II: HỆ THỐNG THÔNG TIN ĐỊA LÝ (GIS) I. TỔNG QUÁT GIS được hình thành từ các ngành khoa học: Địa lý, Bản đồ, Tin học và Toán học. Nguồn gốc của GIS là việc tạo các bản đồ chuyên đề, các nhà qui hoạch sử dụng phương pháp chồng lắp bản đồ (overlay), phương pháp này được mô tả một cách có hệ thống lần đầu tiên bởi Ô. Jacqueline Tyrwhitt trong quyển sổ tay quy hoạch vào năm 1950, kỹ thuật này còn được sử dụng trong việc tìm kiếm vị trí thích hợp cho các công trình được qui hoạch. Việc sử dụng máy tính trong vẽ bản đồ được bắt đầu vào cuối thập niên 50, đầu 60, từ đây khái niệm về GIS ra đời nhưng chỉ đến những năm 80 thì GIS mới có thể phát huy hết khả năng của mình do sự phát triển mạnh mẽ của công nghệ phần cứng. 1. Gis là gì ? Bắt đầu từ thập niên 80, GIS đã trở nên phổ biến trong các lãnh vực thương mại, khoa học và quản lý, chúng ta có thể gặp nhiều cách định nghĩa về GIS: - Là một tập hợp của các phần cứng, phần mềm máy tính cùng với các thông tin địa lý (mô tả không gian). Tập hợp này được thiết kể để có thể thu thập, lưu trữ, cập nhật, thao tác, phân tích, thể hiện tất cả các hình thức thông tin mang tính không gian. - GIS là một hệ thống máy tính có khả năng lưu trữ và sử dụng dữ liệu mô tả các vị trí (nơi) trên bề mặt trái đất - Một hệ thống được gọi là GIS nếu nó có các công cụ hỗ trợ cho việc thao tác với dữ liệu không gian - Cơ sở dữ liệu GIS là sự tổng lợp có cấu trúc các dữ liệu số hóa không gian và phi không gian về các đối tượng bản đồ, mối liên hệ giữa các đối tượng không gian và các tính chất của một vùng của đối tượng - GIS là từ viết tắt của: + G: Geographic - dữ liệu không gian thể hiện vị trí, hình dạng (điểm, tuyến, vùng) + I : Information - thuộc tính, không thể hiện vị trí (như mô tả bằng văn bản, số, tên ) + S: System - Sự liên kết bên trong giữa các thành phần khác nhau (phần cứng, phần mềm) Tóm lại, hệ thống thông tin địa lý (Geographical Information System) là một hệ thống phần mềm máy tính được sử dụng trong việc vẽ bản đồ, phân tích các vật thể, hiện tượng tồn tại trên trái đất. Công nghệ GIS tổng hợp các chức năng chung về quản lý dữ liệu như hỏi đáp (query) và phân tích thống kê (statistical analysis) với sự thể hiện trực quan (visualization) và phân tích các vật thể hiện tượng không gian (geographic analysis) trong bản đồ. Sự khác biệt giữa GIS và các hệ thống thông tin thông thường là tính ứng dụng của nó rất rộng trong việc giải thích hiện tượng, dự báo và qui hoạch chiến lược. 2. Ứng dụng của gis Các hệ thống thông tin địa lý đều có các công cụ mạnh để tạo bản đồ, tổng hợp thông tin, thể hiện các sự kiện, giải quyết các vấn đề phức tạp, thể hiện các ý tưởng. Có thể nói GIS là một công cụ cho nhiều lãnh vực, có thể được sử dụng bởi cá nhân, tổ chức, trường học, để giải quyết các vấn đề của họ. Tạo bản đồ và phân tích bản đồ không phải là mới, nhưng GIS đóng vai trò nâng cao chất lượng, độ chính xác và nhanh hơn so với cách làm bằng tay truyền thống. Và, trước khi có GIS, chỉ một số ít người có khả năng sử
- dụng thông tin địa lý trong việc ra quyết định và giải quyết vấn đề. 21
- Ngày nay, GIS là một công nghệ “đắt giá” (multibillion dollar industry), có hàng trăm ngàn người trên thế giới đang làm việc với nó. Các nhà chuyên môn của hầu hết các lãnh vực đang dần dần nhận thấy lợi ích trong phương pháp suy nghĩ và làm việc theo phương diện địa lý. 3. Thành phần của gis Một hệ thống được gọi là GIS khi nó bao gồm các thành phần sau: - Dữ Liệu Không Gian & Dữ Liệu Thuộc Tính (Spatial & Attribute Database ): DLKG: Mô tả về mặt địa hình như hình dáng, vị trí của đặc trưng bề mặt trái đất, ví dụ như vị trí của khu đất trên bản đồ, hình dạng bề mặt khu vực v.v DLTT: Mô tả về tính chất và giá trị của đặc trưng đó, ví dụ như việc sử dụng đất, người sở hữu, giá trị khu đất, giá trị cao độ v.v - Thành phần Hiển Thị Bản Đồ (Cartographic Display System): Cho phép chọn lọc dữ liệu trong hệ thống để tạo ra bản đồ mới, sau đó trình bày lên màn hình hoặc đưa ra máy in,máy vẽ,v.v - Thành phần Số Hóa Bản Đồ (Map Digitizing System Database): cho phép chuyển đổi các bản đồ trên giấy sang dạng số - Thành phần Quản Lý Dữ Liệu (Database Management System): gồm các module cho phép người dùng nhập số liệu dạng bảng tính, phân tích và sử lý số liệu v.v và lập bảng báo cáo kết quả - Thành phần Xử Lý Aính (Image Processing System): Nắn chỉnh ảnh, xóa nhiễu, lọc ảnh, giải đoán ảnh vệ tinh, ảnh máy bay - Thành phần Phân Tích Thống Kê (Statistical Analysis System): Phân tích tính toán thống kê - Thành phần Phân Tích Dữ liệu Không Gian (Geographic Analysis System): Chồng lắp bản đồ, tạo vùng đệm, tìm vị trí thích nghi Hình I.1 dưới đây thể hiện các thành phần cơ bản của một hệ thống GIS: Anh viãùn thạm Hã thäng xỉ lyï anh Bang biãøu thäng kã Ban âä Hã thäng phán Hã thäng têch sä hoa thäng baín âä kã Dỉỵ Liãûu Dỉỵ Liãûu Khäng Thuäüc Gian Tênh Hã thäng Hã thäng phán têch quaín lyï dỉ DL khäng liãu gian
- Bang biãøu Hã Thäng Hiãn Thë thäng kã Ban Âä Ban âä 22
- Hình I.1. Các thành phần cơ bản của GIS Về phương diện quản lý, ta có thấy GIS bao gồm: - Phần cứng: Các thiết bị điện tử trên nó GIS hoạt động, như máy tính, máy in, scaner, digitizer, (cơ thể) Phán mãm - Phần mềm: Các phần mềm máy tính cho phép thực hiện việc lưu trữ, phân tích và Phán cỉng Dỉ liãu thể hiện thông tin địa lý (bộ óc) - Dữ liệu: là phần quan trọng nhất. Các dữ liệu địa lý, mối liên hệ của chúng và các bảng biểu liên kết có thể được thu thập hay mua từ nhiều nguồn khác nhau. Con ngỉåi Phỉång - Con người: Hiệu suất sử dụng GIS phụ phap thuộc rất lớn vào khả năng của người quản lý hệ thống và người lập kế hoạch phát triển việc ứng dụng GIS trong thực tế. GIS có thể được thiết kế sử dụng bởi nhiều chuyên gia Hçnh I.2. Quan lyï GIS của các lãnh vực khác nhau. - Phương pháp: Sự thành công trong các thao tác với GIS phụ thuộc rất nhiều vào việc hoạch định phương pháp tiến hành công việc (đề cương chi tiết cho một dự án) Bàn digitizer A0 và máy in A0 II. CẤU TRÚC DƯ' LIỆU TRONG GIS Dữ liệu của một hệ thống thông tin địa lý có thể chia thành hai dạng: - Hình ảnh (không gian) - Phi hình ảnh (thuộc tính)
- 1. Dữ liệu không gian Số liệu hình ảnh hay còn gọi là dữ liệu không gian (graphic) là sự mô tả bằng kỹ thuật số các phần tử bản đồ. GIS sử dụng dữ liệu hình ảnh để thể hiện bản đồ ra màn hình hay ra giấy. Trong máy tính, dữ liệu không gian thường được thể hiện dưới các dạng sau: - Điểm: được thể hiện bằng những biểu tượng dạng điểm - Đường gấp khúc hay đoạn cong - Vùng hay đa giác - Các điểm ảnh Các thành phần đồ họa trong cơ sở dữ liệu GIS thương được mô tả bằng nhiều lớp (layer), mỗi lớp chứa một nhóm đối tượng thuần nhất với vị trí của chúng theo hệ tọa độ chung của tất cả các lớp. 2. Dữ liệu phi không gian Số liệu thuộc tính thể hiện các tính chất, số lượng, chất lượng hay mối quan hệ của các phần tử bản đồ và các vị trí địa lý. Chúng được lưu trữ dưới dạng số hay ký tự. Thông thường dữ liệu được quản lý dưới dạng bảng (table) bao gồm cột (column) hay còn được gọi là trường (field), hàng (row) hay còn gọi là mẩu tin (record). Để định nghĩa một trường phải có tên trường (field name) và kiểu dữ liệu của trường (type), kiểu dữ liệu có thể là: kiểu ký tự (character), kiểu số nguyên (interger), kiểu số thực (real), kiểu logic, Ví dụ: ta có bảng dữ liệu về thế giới như sau Tãn trỉång
- Tãn quäc gia Tãn thu âä Dán säú -94 TL GT DS Máøu tin 24
- Mẩu tin thể hiện tổng hợp các tính chất của đối tượng mà nó miêu tả, ví dụ như ở bảng trên, các mẩu tin thể hiện các tính chất, số liệu về các quốc gia như tên quốc gia, tên thủ đô ï, dân số, tỉ lệ gia tăng dân số, 3. Dữ liệu và cơ sở dữ liệu Cơ sở dữ liệu là sự chọn lọch các dữ liệu cần thiết nhất (không có số liệu thừa: redundant data) và các dữ liệu này có thể chia sẻ giữa nhiều hệ thống ứng dụng khác nhau. CSDL có thể được xem như là giao diện giữa số liệu và các chương trình ứng dụng. Ỉïng dung 2 Ỉïng dung 3 Ỉïng dung 1 Ỉïng dung 4 Cå så dỉ liãûu Hình II.1. CSDL và ứng dụng Để cơ sở dữ liệu (CSDL) có thể làm việc tốt, thì trong CSDL không có dữ liệu thừa. 4. Liên kết dữ liệu trong CSDL CSDL bao gồm nhiều tập tin (hay bảng) dữ liệu, các tập tin dữ liệu này nếu mô tả cho cùng một loại đối tượng sẽ được liên kết với nhau bởi các trường khóa (identifier), ví dụ: có hai bảng dữ liệu về sinh viên như sau: MSSV Họ tên Ngày sinh Nơi sinh 25412562 Nguyễn Văn Tuấn 12/8/76 Cần Thơ 25412563 Trần Văn Hoàng 4/10/76 An Giang 25412564 Lê Hoàng Anh 7/04/76 Sóc Trăng MSSV Nền móng Kết cấu bê tông thép gỗ Kiến trúc 25412562 8 9 9 25412563 7 8 5 25412564 5 6 7 Trường khóa trong trường hợp này là trường MSSV. Để biết điểm của sinh viên, ta phải truy số liệu của bảng 1 để biết tên và bảng 2 để biết điểm. Chương trình máy tính sẽ dựa vào trường khóa MSSV để lấy số liệu theo yêu cầu của người truy cập số liệu. III. MÔ HÌNH DƯ' LIỆU KHÔNG GIAN Như chúng ta đã biết, bản đồ là một hình thức thể hiện dữ liệu không gian (saptial data) quen thuộc mà chúng ta thường gặp nhất. Bản đồ trình bày các nhóm điểm, đường và vùng, chúng được đặt ở vị trí địa lý (tọa độ) nào đó. Bản đồ thường được thể hiện ở dạng hai chiều. Các chú thích trên bản đồ cho biết những thông tin hay định nghĩa các điểm, đường và vùng mà nó thể hiện, những thông tin, định nghĩa đó mang tính phi không gian (non
- spatial). 25
- Bản đồ dùng để lưu trữ dữ liệu và cung cấp dữ liệu cho người sử dụng nó. Tuy nhiên ta không thể thể hiện nhiều thông tin trên một bản đồ cùng một lúc vì sẽ làm người dùng khó hiểu. Để giải quyết vấn đề này, trên cùng một khu vực cần thể hiện, người ta vẽ nhiều bản đồ, mỗi bản đồ thể hiện một số thông tin riêng, các bản đồ này còn gọi là bản đồ chuyên đề (thematic map) ví dụ như bản đồ đất đai, bản đồ khí hậu, v.v . Tuy nhiên, tìm kiếm hay phân tích các dữ liệu không gian trên các bản đồ thuộc tính khác nhau thường tốn nhiều thời gian và bất tiện. Hơn nữa, việc vẽ các bản đồ bằng tay cũng tốn rất nhiều thới gian và công sức Trong GIS, việc lưu trữ và thể hiện dữ liệu không gian (DLKG) được phân ra riêng biệt. Dữ liệu có thể được lưu trữ dưới mức độ chi tiết cao và sau đó được thể hiện ở mức độ kém chi tiết hơn và theo tỉ lệ thích hợp với mục tiêu sử dụng của người dụng. Ngoài ra, GIS còn cho phép người dùng thể hiện dữ liệu không gian dưới nhiều hình thức khác nhau như bản đồ chuyên đề cùng với biểu đồ, văn bản mô tả,v.v . Mỗi cách được điều chỉnh tùy theo mục đích sử dụng. Hình III.1Mô hình dữ liệu không gian Trong GIS, DLKG được thể hiện dưới dạng điểm, đường và vùng tương tự như bảm đồ thông thường. Ty nhiên, để dễ quản lý bằng máy tính, DLKG được tổ chức lưu trữ khác với bản đồ. Thông tin về thực thể không gian trong GIS được mô tả bằng 4 thành phần: - Vị trí địa lý của đối tượng được mô tả - Mối liên hệ của đối tượng đó trong không gian - Tính chất của đối tượng (phi không gian) - Thời gian Vị trí địa lý: "ở đâu?".Vị trí của đối tượng trong không gian được thể hiện một cách thống nhất theo một hệ thống tọa độ địa lý nào đó . Trong GIS, các DLKG của cùng 1 cơ sở dữ liệu (CSLD) phải cùng một hệ thống tọa độ. DLKG có thể được lưu trữ ở nhiều tỉ lệ (mức độ chính xác) khác nhau.
- Thuộc tính: Tính chất thứ hai của DLKG là thuộc tính, " nó là cái gì?". Trong GIS, các thuộc tính được lưu trữ và thể hiện dưới dạng bảng biểu. Mỗi trường thể hiện một thuộc tính của đối tượng. Ví dụ để thể hiện tính chất của các con kênh, ta mô tả bằng tên con kênh, năm đào, cấp kênh, năng lực tưới, năng lực tiêu, lưu lượng trung bình, 26
- Mối liên hệ không gian: Các đối tượng địa lý luôn có mối liên hệ không gian với nhau Các liên hệ này có thể là: mằm trong, bên cạnh, cắt nhau, ở trên, ở dưới, , ví dụ như con đường nằm cạnh bờ kênh, khu nông trường nằm trong huyện A, con đường B cắt ngang con đường C , Thời gian: Một số sự vật, hiện tượng có sự thay đổi theo thời gian như sử dụng đất nông nghiệp, thời tiết, do đó khi mô tả các sự vật hiện tượng này người ta luôn thể hiện thời điểm thu thập (đo đạc) dữ liệu. 1. Mô hình dữ liệu raster Đây là hình thức đơn giản nhất để thể hiện dữ liệu không gian, mô hình raster bao gồm một hệ thống ô vuông hoặc ô chữ nhật được gọi là pixel (hay một phần tử của ảnh). Vị trí của mỗi pixel được xác định bởi số hàng và số cột. Giá trị được gán vào pixel tượng trưng cho một thuộc tính mà nó thể hiện. Ví dụ một căn nhà được thể hiện bằng 1 pixel có giá trị là H, con sông được thể hiện bằng nhiều pixel có cùng giá trị là R, tương tự khu rừng cũng được thể hiện bằng một nhóm pixel có cùng giá trị là D (cây dừa) hoặc S (cây soài). Kích thước của pixel càng nhỏ thì hình ảnh nó thể hiện càng sắc nét, thông số thể hiện độ sắc nét gọi là độ tương phản (resolution). Aính có độ tương phản cao, thì độ sắc nét càng cao, kích thước pixel nhỏ. Tuy nhiên, hai ảnh raster có cùng kích thước, nếu ảnh nào có độ tương phản cao thì file dữ liệu chứa nó sẽ lớn hơn. Ví dụ nếu 1 pixel thể hiện một diện tích là 250m x 250m mặt đất trên thực tế, thì để thể hiện một khoảng cách 1km ta cần 4 pixel, để thể hiện một diện tích 1km x 1km ta cần 16 pixel. Khi ta giảm kích thước pixel xuống còn 100m x 100m, để thể hiện một khoảng cách 1km ta cần 10 pixel, để thể hiện một diện tích 1km x 1km ta cần 100 pixel. Vì kích thước của file dữ liệu liên quan tới số lượng pixel nên ta thấy rằng kích thước của file tăng lên đáng kể khi ta tăng độ tương phản của ảnh raster. Một ảnh raster thông thường bao gồm hàng triệu pixel. Tuy nhiên, nhiều pixel gần nhau sẽ có cùng giá trị. Người ta dùng nhiều phương pháp nén (data compression) khác nhau để giảm kích thước file ảnh raster như là phương pháp Run-Length Encoding , phương pháp Value Point Encoding và phương pháp Quadtrees. (hình III.2) a. Phương pháp Run-Length Encoding:
- Trong phương pháp này, file dữ liệu sẽ lưu trữ thông tin về các run, mỗi run là một nhóm các pixel có cùng giá trị nằm liên tục nhau trên cùng một dòng, run được định nghĩa bởi giá trị (value), chiều dài (length) và dòng (row). 27
- b. Phương pháp Value Point Encoding: Trong phương pháp này , dữ liệu được lưu trữ là dòng và cột của điểm cuối cùng của một dãy các pixel có cùng giá trị. Hình III.2 Nén dữ liệu raster c. Phương pháp Quatrees: Ở phương pháp này, người ta chia ảnh thành các tiểu vùng. Mỗi một tiểu vùng phải có cùng một giá trị. Việc phân chia tiểu vùng được tiến hành như sau: - Chia ảnh ra làm bốn phần bằng nhau - Nếu phần ảnh nào nhiều giá trị khác nhau thì tiếp tục chia tiếp phần ảnh đó làm bốn. - Tiếp tục xét các phần tư nhỏ và chia chúng ra làm tư nếu còn có sự khác biệt về giá trị trong nó.
- Hình III.3. Phương pháp Quadtree 28
- 2. Mô hình dữ liệu vector Mô hình dữ liệu vector thể hiện vị trí chính xác của vật thể hay hiện tượng trong không gian. Trong mô hình dữ liệu vector, người ta giả sử rằng hệ thống tọa độ là chính xác. Thực tế, mức độ chính xác bị giới hạn bởi số chữ số dùng để thể hiện một giá trị trong máy tính, tuy nhiên nó chính xác hơn rất nhiều so với mô hình dữ liệu raster. Vật thể trên trái đất được thể hiện trên bản đồ dựa trên hệ tọa độ hai chiều x,y (Cartesian coordinate system), trên bản đồ vật thể có thể được thể hiện như là các điểm (point) , đường (line) hay miền (area). Mô hình dữ liệu vector cũng tương tự như vậy, một vật thể dạng điểm (point feature) được chứa dưới dạng cặp tọa độ x,y; một vật thể dạng đường (line feature) được chứa dưới dạng một chuỗi các cặp tọa độ x,y; mộtvật thể dạng vùng (area feature) được chứa dưới dạng một chuỗi cặp tọa độ x,y với cặp đầu tọa độ bằng với cặp tọa độ cuối, hay còn gọi là đa giác (polygon). Trong hình III.4, các vật thể được số hóa (digitize) bằng các cặp tọa độ x,y. Vị trí của điểm A được thể hiện bởi tọa độ 2,3 và đường được thể hiện bởi chuỗi tọa độ 1,7; 3,6; 3,4; 5,3. Đa giác được thể hiện bởi một chuỗi tọa độ khác trong đó tọa độ đầu và cuối bằng nhau: 7,10; 9,8; 8,7; 9,5; 7,5; 5,7; 7,10. Trong thí dụ này đơn vị của các tọa độ là tùy ý. Tuy nhiên trong GIS, vị trí thường được lưu trữ theo một hệ qui chiếu chuẩn như là hệ thống UTM, hệ thống quốc gia hay hệ kinh tuyến, vĩ tuyến. Hình III.4 Thể hiện vật thể dạng điểm, đường, vùng theo chuỗi các cặp tọa độ Trong mô hình dữ liệu vector, tùy theo cách lưu trữ dữ liệu, người ta chia ra thành các mô hình: Spaghetti Data Model, Topological Model, Triangulated Irregular Network (TIN), tạm dịch là mô hình dữ liệu kiểu mì ống, mô hình dữ liệu hình học và mô hình lưới tam giac bất qui tắc. a. Spaghetti Data Model (SDM): Trong SDM, tọa độ của các vật thể trên bản đồ được chuyển đổi và ghi nhận vào file dữ liệu theo từng dòng danh sách các cặp tọa độ. Như vậy các cặp tọa độ của cạnh chung của hai đa giác kề nhau phải được lập lại hai lần, mỗi lần cho một đa giác. Cấu trúc của dạng mô hình này rất dễ hiểu, tuy nhiên mối liên hệ của các vật thể trong ảnh không được ghi nhận.
- Hình III.5 Mô hình dữ liệu vectơ kiểu spaghetti b. Topological Model: Đây là dạng mô hình dữ liệu được sử dụng rộng rãi nhất để lưu trữ dữ liệu không gian. Hình học là phương pháp toán học dùng cho việc xác định mối liên hệ giữa các vật thể trong không gian. Người ta còn gọi mô hình này là mô hình Arc-node. Arc là một chuỗi các đoạn thẳng được bắt đầu và kết thúc bằng nút (node). Một node là một giao điểm của hai hay nhiều arc. Một node có thể xuất hiện ở điểm cuối của một dangling arc . Hình III.6 Mô hình dữ liệu vectơ kiểu topology Trong hình III.6 dữ liệu được lưu trữ trong 4 bảng. Bảng Polygon Topology liệt kê danh sách các arc tạo thành các đa giác (polygon), chú ý là nếu trong một polygon có các arc nằm trọn trong nó thì trong danh sách các arc tạo thành polygon đó trước và sau arc đó phải ghi số 0 như trường hợp polygon B. Vùng bên ngoài bản đồ cũng được xem như là một polygon . Bảng Node Topology liệt kê các arc đi qua cùng một node hay các node của dangling arc, Chú ý rằng điểm đóng của một đa giác được coi là một node và một điểm vừa được coi là một node và vừa được coi là một arc (trường hợp N5 và N6). Bảng Arc
- Topology liệt kê node đầu, node cuối, polygon bên trái và polygon bên phải của các Arc trong bản đồ. Nhìn vào các bảng này ta có thể dễ dàng biết được mối liên hệ của một vật 30
- thể đối với các vật thể xung quanh. Ví dụ, ta xét điểm N5, trong bảng Arc Topology ta thấy left polygon và right polygon đều là B, như vậy điểm N5 nằm trong polygon B. Hay xét arc a5, ta thấy left polygon là A, right polygon là B, như vậy a5 nằm giữa hai polygon A và B. Bảng Arc Coordinate Data liệt kê danh sách tọa độ các node tạo nên arc, các tọa độ này được phân ra tọa độ bắt đầu, tọa độ trung gian và tọa độ kết thúc. Topology model rất thích hợp cho các thao tác phân tích không gian (spatial analysis) vì đa số các bài toán phân tích không gian, người ta không dùng đến dữ liệu về tọa độ, mà chỉ cần dùng đến dữ liệu hình học. c. Triangular Irregular Network (TIN): TIN thường được dùng để thể hiện dữ liệu về địa hình (terrain data). TIN thể hiện bề mặt địa hình như là tập hợp các mặt tam giác liên kết với nhau (hình III.7). Mỗi đỉnh của tam giác được thể hiện bằng tọa độ địa lý x,y và z, thường z thường được gán bằng với giá trị cao độ của địa hình. Mỗi mặt của tam giác được gán cho một chữ cái và ba đỉnh của nó được gán bằng chữ số. Bảng Nodes (nút) thể hiện danh sách đỉnh của từng tam giác, bảng Edges (cạnh) thể hiện danh sách các tam giác nằm xung quang của từng tam giác, bảng X-Y coordinate thể hiện tọa độ của các đỉnh, bảng z coordinate thể hiện giá trị z của các đỉnh đó. TIN rất thích hợp trong việc tính toán các thông số của địa hình như độ dốc, hướng dốc.
- Hçnh III.7. Mä hçnh dỉỵ liãûu vectå kiãu TIN 32
- Bảng so sánh giữa mô hình dữ liệu Raster và Vector Mô hình Raster Mô hình Vector Ưu điểm Ưu điểm 1. Đơn giản 1. Cấu trúc dữ liệu nén nhiều hơn so với mô hình 2. Thao tác chồng lắp (overlay) dễ dàng raster 3. Thích hợp cho việc thể hiện dữ liệu phức tạp 2. Thể hiện liên hệ hình học do đó thích hợp cho (đa dạng) các phân tích về hình học hay phân tích về 4. Thích hợp cho việc nâng cấp, xư lý ảnh mạng lưới 3. Thích hợp cho việc số hóa các bản đồ được vẽ bằng tay Nhược điểm Nhược điểm 1. Khả năng nén kém 1. Phức tạp 2. Không thể hiện rõ liên hệ hình học 2. Thao tác chồng lắp phức tạp 3. Thể hiện bản đồ không rõ nét nếu ô tương 3. Không thích hợp cho việc thể hiện dữ liệu phản thấp, nhưng nếu dùng độ tương phản cao phức tạp (đa dạng) sẽ làm tăng kích thước file ảnh. 4. Không thích hợp cho việc nâng cấp, xử lý ảnh IV. CƠ SỞ DƯ' LIỆU KHÔNG GIAN(CSDLKG) CSDLKG miêu tả các vật thể hay hiện tượng (gọi chung là đối tượng bản đồ) từ thực tế dưới dạng: - Vị trí của đối tượng theo một hệ tọa độ nào đó (vd: hệ lat/long theo độ, phút, giây hay theo hệ UTM bắc hoặc nam) - Các tính chất liên quan đến đối tượng tương ứng (vd: giá cả, màu sắc, ) - Mối liên hệ giữa các đối tượng xung quanh (mối liên hệ hình học- mô tả sự nối kết hay không nối kết, ) - Thời gian xảy ra hiện tượng, hay thời điểm đo đạc CSDLKG bao gồm nhiều lớp DLKG giống như lớp bản đồ. Mỗi lớp DLKG chỉ thể hiện một dạng thông tin (lớp mưa, lớp sử dụng đất, lớp nguồn ô nhiễm không khí, ) Dỉ liãu khäng gian Dỉ liãu phi khäng gian
- Ví dụ: Các lớp dữ liệu phục vụ nông nghiệp 33
- Låïp dỉ liãûu vãư âát Låïp dỉ liãûu haìm lỉåüng N Låïp dỉ liãûu âäü màn Låïp dỉ liãûu vãư nàng suát Các cấp độ mô tả thông tin không gian: 1. Đối với mô hình dữ liệu raster
- - Mỗi pixel là một đối tượng, có vị trí theo hàng, cột tương ứng trên ảnh, giá trị của pixel cho biết pixel đó thuộc loại đối tượng nào, tính chất của đối tượng đó được lưu trữ ở một cơ sở dữ liệu thuộc tính tương ứng. - CSDLKG Raster có thể chứa hàng ngàn lớp DLKG (layer). 34
- - Kiểu giá trị của pixel trong mỗi layer tùy theo việc mã hóa của người sử dụng, có thể là số nguyên, số thực hay ký tự alphabet. Thường giá trị số nguyên thường được dùng làm mã số để liên hệ với bảng DL khác hay làm chú giải để thể hiện bản đồ. - Để thể hiện một bề mặt liên tục, người ta sử dụng mô hình raster, các bề mặt liên tục này thường thể hiện bề mặt địa hình, mưa, áp suất không khí, nhiệt độ, mật độ dân số, Như vật đối với CSDLKG raster các thông tin được tổ chức như hình dưới đây: tênh cháút 1 Sä liãûu vãư vë trê, code cua pixel tênh cháút 2 tênh cháút n 2. Đối với mô hình dữ liệu vector Để thể hiện các kiểu đối tượng (vd: như đường sá, sông ngòi, cao độ, thực vật, ) dưới dạng số (digital) trong CSDLKG, ta phải lựa chọn kiểu đối tượng không gian thích hợp: - Dạng 0 chiều (0D): Một đối tượng có vị trí trong không gian nhưng không có chiều dài. Dạng điểm - Dạng 1 chiều (1D): Một đối tượng có một chiều dài kết hợp với 1 hoặc nhiều đối tượng 0D. Dạng tuyến - Dạng 2 chiều (2D): Một đối tượng có một chiều dài và chiều rộng được bao quanh bởi ít nhất ba đối tượng 1D. Dạng diện tích-vùng - Dạng 3 chiều (3D): Một đối tượng có một chiều dài, chiều rộng và chiều cao/chiều sâu được bao quanh bằng ít nhất 2 đối tượng 2D. Dạng thể tích
- - Dạng 4 chiều (4D): bao gồm 1 đối tượng 3D và yếu tố thời gian Đối với CSDLKG vector, người ta cũng lưu trữ theo từng lớp DLKG, mỗi lớp chỉ thể hiện một loại thông tin và một dạng đối tượng (0D, 1D, 2D, 3D, 4D), Ví dụ trong CSDLKG về qui hoạch nông nghiệp, người ta có các lớp DLKG về đất (dạng vùng, mỗi vùng thể hiện một loại đất), lớp DLKG về hệ thống kênh (dạng tuyến, thể hiện các con kênh), lớp công 35
- trình trên kênh (loại điểm, thể hiện cống, trạm bơm, đập tràn, ), lớp DLKG về trạm mưa (dạng điểm, thể hiện các trạm đo mưa), Như chúng ta đã biết trong mô hình vector, người ta có thể dùng nhiều phương pháp để lưu trữ vị trí cùa đối tượng, còn để liên hệ các đối tượng đó với tính chất của chúng trong CSDL, người ta làm như sau: - Đối với dạng điểm: mỗi điểm được gán 1 mã số, mã số này sẽ tương ứng với mã số được ghi trong các bảng CSDL thuộc tính thể hiện các thuộc tính của các điểm tương ứng. - Đối với dạng tuyến: một đối tượng dạng tuyến được vẽ bằng nhiều đoạn nối (link) của các nút (node). Tương tự như đối tượng dạng điểm, mỗi đối tượng dạng tuyến cũng được gán một giá trị mã số (code), code này được dùng để liên hệ với các bảng DL thuộc tính mô tả đối tượng đó. Ngoài ra mỗi nút cũng có các thông tin thuộc tính như nút vượt, nút cắt, nút val (đường ống), nút đèn giao thông (đường). Các link cũng có các thuộc tính như hướng, kích thước (đường kính ống, chiều rộng đường), số làn xe, thời gian di chuyển từ đầu link đến cuối link, hoặc điện thế của đường tải điện, đường hầm, đường vượt, - Đối với dạng vùng: thường là các vùng phân chia theo một tính chất nào đó hay biên giới hành chính, hồ, rừng núi, khu vực điều tra dân số, biên của chúng được xác định bởi thuộc tính của chính đối tượng đó. Mỗi vùng cũng được gán code và liên hệ với bảng DL thuộc tính. Như vật đối với CSDLKG vector các thông tin được tổ chức như hình dưới đây: Dỉ liãûu thuäc tênh (tênh cháút) Code cua ÂT Dỉ liãûu khäng gian (vë trê, hçnh dảng) V. CÁC PHƯƠNG PHÁP PHÂN TÍCH DƯ' LIỆU KHÔNG GIAN CƠ BẢN (Basic spacial operations) 1. Thuật toán trên VECTOR a. Phân loại (reclassify) Ghép hai hay nhiều đối tượng không gian có cùng chung một hay nhiều đặc trưng nào đó hay cùng thoả một điều kiện nào đó thành 1, phương pháp này được sử dụng trong việc phân loại lại các đối tượng thành đối tượng mới tổng quát hơn, đối tượng mới có hình dạng là tổng của các đối tượng cũ và mang tính chất (dữ liệu thuộc tính) của tất cả các đối tượng cũ Các bước để thực hiện bài toán reclassify là: - Xác định điều kiện phân loại
- - Phân loại các đối tượng theo điều kiện phân loại - Bỏ các biên chung của các đối tượng kề nhau cùng thỏa điều kiện phân loại 36
- - Tạo lại cấu trúc của đối tượng mới Hçnh IV.1. Reclassify, Dissolve va Merge b. Vùng đệm (Buffer) Tạo đối tượng mới xung quanh đối tượng cũ trong một khoảng cách được đã cho. Phương pháp này thường được ứng dụng trong qui hoạch, như xác định vùng đệm của khu bảo tồn thiên nhiên, hay xác định vùng ảnh hưởng của nguồn ô nhiễm tiếng ồn, Ta có thể tạo vùng đệm cho đối tượng dạng điểm,tuyến hay vùng.
- Hçnh IV.2. Buffer 37
- c. Chồng bản đồ (Overlay) Phương pháp này thường được dùng nhất trong việc liên kết các dữ liệu không gian. Thí dụ như việc tìm kiếm các giếng khoan theo phân vùng hành chánh, ta có hai lớp DLKG là lớp giếng khoan (dạng điểm) và lớp DLKG biên xã (dạng vùng), vậy để xem giếng nào thuộc xã nào, ta chồng hai lớp này lại với nhau. Ta chỉ có thể chồng các lớp dữ liệu dạng điểm lên lớp đối tượng dạng vùng, hay lớp đối tượng dạng vùng lên lớp đối tượng dạng vùng, hay lớp đối tượng dạng tuyến lên lớp đối tượng dạng vùng.
- 2. Thuật toán trên RASTER a. Các phép toán đại số trên bản đồ (+ , - , *, /) Thông thường, để thiết lập các bản đồ tổng hợp (combine map) chúng ta phải thực hiện các công thức và các phương trình toán học, ví dụ như chúng ta muốn lập một bản đồ khả năng xói mòn đất (soil erosion potential) dựa trên công thức liên hệ giữa các yếu tố về khả năng xói mòn của đất với gradient độ dốc và cường độ mưa. Các công thức toán học có thể chứa các hằng số, các công thức lượng giác, các phép tính cộng, trừ, nhân, chia. Tênh giạ trë cua 1 vë trê X trãn baín âä ưtheo haìm säú F: Kãút qua tải vë trê X = F(gia trë ä X låp 1, giạ trë ä X låp 2, ) Để làm rõ khái niệm trên ta xét ví dụ sau: chúng ta muốn xây dựng một bản đồ nhiệt độ dựa trên bản đồ địa hình có sẵn và một công thức liên hệ giữa cao độ và nhiệt độ ở một vùng (công thức này được lập bằng các phép toán thống kê):Y=26.985-0.0016xX. Trong đó Y là nhiệt độ tại một điểm còn X là cao độ điểm đó. Trước hết ta tạo một bản đồ bản đồ tạm thời bằng cách nhân địa hình với -0.0016, sau đó cộng bản đồ tạm này với 26.985. Ví dụ: 1 3 2 3 4 5 7 9 1 1 2 2 1 2 5 4 8 10 2 0
- 2 1 4 5 3 + 7 4 5 7 4 3 3 5 3 4 = 6 2 4 11 3 3 3 1 5 2 9 9 4 7 7 2 4 3 2 7 10 8 2 10 2 39
- b. Các phép toán luận lý trên bản đồ (bolean operation) Các phép toán luận lý có thể thực hiện được trong GIS là : - Phép toán AND ("và" hay "giao") - Phép toán OR ("hoặc" hay "hợp") - Phép toán NOT ("hiệu" ) - Phép toán XOR (ngược lại của OR) Các phép toán này có thể được thể hiện bằng hình dưới đây: A AND A OR B A AND (B OR A NOT A XOR (A AND B) OR C Trong MHDLKG Raster, khi phân tích số liệu trên nhiều lớp bản đồ, cách khác giá trị của các pixel cùng vị trí được dùng làm tham số tính toán của phép toán được áp dụng Thông thường trước khi phân tích luận lý, người ta thường phân loại lại bản đồ raster như sau, nếu pixel thoả điều kiện thì gán giá trị là 1, nếu không thỏa thì gán giá trị là 0 0 0 0 0 0 0 0 0 1 2 4 2 2 2 1 2 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 2 3 3 4 3 3 5 3 0 0 0 0 0 0 0 0 0 0 1 1 1 1 0 0 X 7 6 3 5 2 4 3 2 = 0 0 3 5 2 4 0 0 0 0 0 1 1 1 0 0 (AND) 2 2 3 5 7 5 4 1 0 0 0 5 7 5 0 0 0 0 0 0 1 1 0 0 3 4 5 2 1 1 2 3 0 0 0 0 1 1 0 0 0 0 0 0 0 0 0 0 1 7 5 3 3 1 3 4 0 0 0 0 0 0 0 0 c. Phân tích lân cận (Neighbourhood) Phép phân tích này cho phép ta tính toán giá trị của một pixel dựa trên giá trị của các pixel xung quanh. Phép phân tích này thường được dùng trong việc làm rõ nét ảnh hay loại bỏ các điểm nhiễu trên ảnh.
- TÀI LIỆU THAM KHẢO: 1. Some selected Papers for GIS courses, 1996, ITC, the Netherlands 2. C.A.Blok, et.al. 1993, Cartographic Visualzation for GIS Postgraduate diploma courses ITC, Hà Lan. 3. Huỳnh, L, 1998, Bản Đồ Học, NXBGD 4. Thận, N.T & Dũng N.T, 1999, Trắc Địa và Bản Đồ Kỹ Thuật Số Trong Xây Dựng, NXNBGD 5. Mạnh P.T., Thành.P.V, 1999, Cơ Sở Hệ Thống Thông Tin Địa Lý (GIS) trong Quy Hoạch và Quản Lý Đô Thị, NXBXD 6. ESRI, 1995, Understanding GIS the ARC/INFO method, USA 7. ESRI, 1995, Map Projection, USA 8. Howe D.R. 1989, Data Analysis for Data Base Design, Edward Arnold 9. Hawryszkiewycz I.T. 1994, System Analysis and Design, Prentice Hall 10. Burrough P.A. 1992, Principles of GIS for land resources assessment 11. Martien Molennar. 1997, Lechture notes on Object Modelling Methodology, ITC, the Netherlands 12. Tuladhar A.M. 1996, Lechture note on Spatial Data Models and Structure in GIS, ITC, the Netherlands 13. Paresi, 1995, Lechture note on Structure Information Systems Development Methodologies, ITC, the Netherlands 14. Sharifi M.A. 1996, Introduction to Decision Support Systems for Natural Resource Management, ITC, the Netherlands 15. Sharifi M.A. 1996, Introduction to Multicriteria Evaluation Techniques, ITC, the Netherlands 16. Trung N.H. 1997, Application of Object Modelling Technique on Development of GIS for Natural Resources Management, ITC, the Netherlands 17. Benwell G.L. 1994, A System Development Methodology for Geomatics as Derived form Informatics, Newzealand