Nghiên cứu, xây dựng giải pháp bảo mật thông tin trong thương mại điện tử

pdf 140 trang huongle 4190
Bạn đang xem 20 trang mẫu của tài liệu "Nghiên cứu, xây dựng giải pháp bảo mật thông tin trong thương mại điện tử", để tải tài liệu gốc về máy bạn click vào nút DOWNLOAD ở trên

Tài liệu đính kèm:

  • pdfnghien_cuu_xay_dung_giai_phap_bao_mat_thong_tin_trong_thuong.pdf

Nội dung text: Nghiên cứu, xây dựng giải pháp bảo mật thông tin trong thương mại điện tử

  1. BAN CƠ YẾU CHÍNH PHỦ BÁO CÁO ĐỀ TÀI NHÁNH “NGHIấN CỨU, XÂY DỰNG GIẢI PHÁP BẢO MẬT THễNG TIN TRONG THƯƠNG MẠI ĐIỆN TỬ” SẢN PHẨM SỐ 3: AN TOÀN THễNG TIN CHO CƠ SỞ DỮ LIỆU Thuộc đề tài : “Nghiờn cứu một số vấn đề kỹ thuật, cụng nghệ chủ yếu trong thương mại điện tử và triển khai thử nghiệm – Mó số KC.01.05” Hà nội, thỏng 9 năm 2004
  2. nội dung Tổng quan về an toàn cơ sở dữ liệu 1 1. Giới thiệu 1 2. Một số khái niệm CSDL 2 3.Vấn đề an toàn trong CSDL 7 4. Kiểm soát an toàn 12 5. Thiết kế CSDL an toàn 30 Thiết kế CSDL an toàn 34 1. Giới thiệu 34 2. Thiết kế DBMS an toàn 35 Giải pháp bảo vệ dữ liệu CSDL 88 Mô hình WinSock 89 1. Winsock Model 89 2. Xây dựng DLL trên các Winsock 92 3. Sự liên kết giữa Client và Server trong mô hình Winsock 93 4. Các trạng thái của socket 94 Xây dựng Socket an toàn 99 1. Các yêu cầu khi thiết kế 99 2. Kiến trúc 100 3. Thực hiện 101 4. Thoả thuận 104 Ch−ơng trình thử nghiệm 107 1
  3. Tổng quan về an toμn thông tin trong cơ sở dữ liệu 1 Giới thiệu Sự phát triển lớn mạnh của công nghệ thông tin trong những năm qua đã dẫn đến sử dụng rộng rãi hệ thống máy tính trong mọi tổ chức cá nhân và công cộng, chẳng hạn nh− ngân hàng, tr−ờng học, tổ chức dịch vụ và sản xuất. Độ tin cậy của phần cứng, phần mềm ngày một đ−ợc nâng cao cùng với việc liên tục giảm giá, tăng kỹ năng chuyên môn của các chuyên viên thông tin và sự sẵn sàng của các công cụ trợ giúp đã góp phần khuyến khích việc sử dụng dịch vụ máy tính một cách rộng rãi. Vì vậy, dữ liệu đ−ợc l−u giữ và quản lý trong các hệ thống máy tính nhiều hơn. Cơ sở dữ liệu sử dụng các hệ quản trị cơ sở dữ liệu đã đáp ứng đ−ợc các yêu cầu về l−u giữ và quản lý dữ liệu. Nhiều ph−ơng pháp luận thiết kế cơ sở dữ liệu đã đ−ợc phát triển nhằm hỗ trợ các yêu cầu thông tin khác nhau và các môi tr−ờng làm việc của ứng dụng. Các mô hình dữ liệu khái niệm và lôgíc đã đ−ợc nghiên cứu, cùng với những ngôn ngữ thích hợp, các công cụ định nghĩa dữ liệu, thao tác và hỏi đáp dữ liệu. Mục tiêu là đ−a ra các DBMS có khả năng quản trị và khai thác dữ liệu tốt. Một đặc điểm cơ bản của DBMS là khả năng quản lý đồng thời nhiều giao diện ứng dụng. Mỗi ứng dụng có một cái nhìn thuần nhất về cơ sở dữ liệu, có nghĩa là có cảm giác chỉ mình nó đang khai thác cơ sở dữ liệu. Đây là một yêu cầu hết sức quan trọng đối với các DBMS, ví dụ cơ sở dữ liệu của ngân hàng với các khách hàng trực tuyến của nó; hoặc cơ sở dữ liệu của các hãng hàng không với việc đặt vé tr−ớc. Xử lý phân tán đã góp phần phát triển và tự động hoá các hệ thống thông tin. Ngày nay, đơn vị xử lý thông tin của các tổ chức và các chi nhánh ở xa của nó có thể giao tiếp với nhau một cách nhanh chóng thông qua các mạng máy tính, vì vậy cho phép truyền tải rất nhanh các khối dữ liệu lớn. Việc sử dụng rộng rãi các cơ sở dữ liệu phân tán và tập trung đã đặt ra nhiều yêu cầu nhằm đảm bảo các chức năng th−ơng mại và an toàn dữ liệu. Trong thực tế, các sự cố trong môi tr−ờng cơ sở dữ liệu không chỉ ảnh h−ởng đến từng ng−ời sử dụng 2
  4. hoặc ứng dụng, mà còn ảnh h−ởng tới toàn bộ hệ thống thông tin. Các tiến bộ trong kỹ thuật xử lý thông tin (các công cụ và ngôn ngữ) đã đơn giản hoá giao diện giữa ng−ời và máy phục vụ cho việc tạo ra các cơ sở dữ liệu đáp ứng đ−ợc cho nhiều dạng ng−ời dùng khác nhau; Vì vậy đã nảy sinh thêm nhiều vấn đề về an toàn. Trong các hệ thống thông tin, máy tính, kỹ thuật, công cụ và các thủ tục an toàn đóng vai trò thiết yếu, đảm bảo tính liên tục và tin cậy của hệ thống, bảo vệ dữ liệu và các ch−ơng trình không bị xâm nhập, sửa đổi, đánh cắp và tiết lộ thông tin trái phép. An toàn thông tin trong cơ sở dữ liệu An toàn thông tin trong cơ sở dữ liệu bao gồm 3 yếu tố chính: tính bí mật, toàn vẹn và sẵn sàng. Trong tài liệu này, các thuật ngữ nh− gán quyền, bảo vệ và an toàn sẽ đ−ợc sử dụng để diễn đạt cùng một nội dung trong các ngữ cảnh khác nhau. Chính xác hơn, thuật ngữ gán quyền đ−ợc sử dụng trong các hệ thống cơ sở dữ liệu, thuật ngữ bảo vệ th−ờng sử dụng khi nói về hệ điều hành, còn thuật ngữ an toàn đ−ợc sử dụng chung. Bảo mật là ngăn chặn, phát hiện và xác định những tiếp cận thông tin trái phép. Nói chung, bảo mật là bảo vệ dữ liệu trong các môi tr−ờng cần bảo mật cao, ví dụ nh− các trung tâm quân sự hay kinh tế quan trọng. Tính riêng t− (privacy) là thuật ngữ chỉ ra quyền của một cá nhân, một nhóm ng−ời, hoặc một tổ chức đối với các thông tin, tài nguyên nào đó. Tính riêng t− đ−ợc luật pháp của nhiều quốc gia bảo đảm. Bí mật là yếu tố quan trọng nhất để đảm bảo an toàn trong các môi tr−ờng, cả quân sự lẫn th−ơng mại. Đảm bảo tính toàn vẹn có nghĩa là ngăn chặn, phát hiện và xác định các sửa đổi thông tin trái phép. Đảm bảo tính sẵn sàng có nghĩa là ngăn chặn, phát hiện và xác định các từ chối truy nhập chính đáng vào các dịch vụ mà hệ thống cung cấp. 2. Một số khái niệm CSDL Cơ sở dữ liệu là một tập hợp dữ liệu không nhất thiết đồng nhất, có quan hệ với nhau về mặt lôgíc và đ−ợc phân bố trên một mạng máy tính. Hệ thống phần mềm cho phép quản lý, thao tác trên cơ sở dữ liệu, tạo ra sự trong suốt phân tán với ng−ời dùng gọi là hệ quản trị cơ sở dữ liệu (DBMS). 3
  5. Trong thiết kế cơ sở dữ liệu, chúng ta cần phân biệt pha quan niệm và pha lôgíc. Các mô hình quan niệm và lôgíc t−ơng ứng th−ờng dùng để mô tả cấu trúc của cơ sở dữ liệu. Trong các mô hình này, mô hình lôgíc phụ thuộc vào hệ quản trị cơ sở dữ liệu, còn mô hình quan niệm thì độc lập với hệ quản trị cơ sở dữ liệu. Mô hình quan hệ thực thể là một trong các mô hình quan niệm phổ biến nhất, đ−ợc xây dựng dựa trên khái niệm thực thể. Thực thể đ−ợc xem nh− là lớp các đối t−ợng của thế giới hiện thực đ−ợc mô tả bên trong cơ sở dữ liệu và quan hệ mô tả mối liên hệ giữa hai hay nhiều thực thể. Trong quá trình thiết kế lôgíc, l−ợc đồ khái niệm đ−ợc chuyển sang l−ợc đồ lôgíc, mô tả dữ liệu theo mô hình lôgíc do DBMS cung cấp. Các mô hình phân cấp, mạng và quan hệ là các mô hình lôgíc do công nghệ DBMS truyền thống quản lý. Các ngôn ngữ sẵn có trong DBMS bao gồm ngôn ngữ định nghĩa dữ liệu (DDL), ngôn ngữ thao tác dữ liệu (DML) và ngôn ngữ hỏi (QL). DDL hỗ trợ định nghĩa l−ợc đồ cơ sở dữ liệu lôgíc. Các phép toán trên dữ liệu đ−ợc xác định thì sử dụng DDL, hoặc QL. Các thao tác trên cơ sở dữ liệu bao gồm tìm kiếm, chèn, xoá và cập nhật. Để sử dụng DML, yêu cầu hiểu biết đầy đủ về mô hình, l−ợc đồ logíc và DML đ−ợc những ng−ời dùng đặc biệt sử dụng, chẳng hạn nh− các nhà phát triển ứng dụng. QL thì ng−ợc lại, nó là ngôn ngữ khai báo hỗ trợ cho ng−ời dùng cuối. Ngôn ngữ DML có thể nhúng trong một ngôn ngữ lập trình thông th−ờng, gọi là ngôn ngữ nhúng. Vì vậy, các ứng dụng sử dụng ngôn ngữ lập trình có thể đ−a vào các câu lệnh của DML cho các phép toán h−ớng dữ liệu. 2.1 Các thành phần của DBMS Một DBMS thông th−ờng bao gồm nhiều môđun t−ơng ứng với các chức năng sau: • Định nghĩa dữ liệu - DDL • Thao tác dữ liệu - DML • Hỏi đáp cơ sở dữ liệu - QL • Quản trị cơ sở dữ liệu - DBMS • Quản lý file Tập hợp dữ liệu hỗ trợ các môđun này là: 4
  6. • Các bảng mô tả cơ sở dữ liệu • Các bảng trao quyền • Các bảng truy nhập đồng thời Ng−ời dùng cuối hoặc các ch−ơng trình ứng dụng có thể sử dụng dữ liệu trong cơ sở dữ liệu, thông qua các câu lệnh DML hoặc QL. Sau đó, DBMS sẽ biên dịch các câu lệnh này thông qua bộ xử lý DML và QL. Kết quả là đ−a ra các câu hỏi tối −u theo l−ợc đồ cơ sở dữ liệu (đã đ−ợc trình bày trong các bảng mô tả cơ sở dữ liệu). Những bảng này đ−ợc định nghĩa thông qua các câu lệnh của DDL và đ−ợc trình biên dịch DDL biên dịch. Các câu hỏi tối −u đ−ợc bộ quản trị cơ sở dữ liệu xử lý và chuyển thành các thao tác trên các file dữ liệu vật lý. Bộ quản trị cơ sở dữ liệu cũng kiểm tra lại quyền của ng−ời dùng và các ch−ơng trình khi truy nhập dữ liệu, thông qua bảng trao quyền truy nhập. Các thao tác đ−ợc phép đ−ợc gửi tới bộ quản lý file. Bộ quản trị cơ sở dữ liệu cũng chịu trách nhiệm quản lý truy nhập dữ liệu đồng thời. Bộ quản trị file sẽ thực hiện các thao tác này. 5
  7. Vùng làm việc của các trình ứng dụng Các trình ứng dụng Thủ tục của DBMS Cơ sở Các lệnh DML dữ liệu Vùng làm việc của DBMS Hình 1 T−ơng tác giữa trình ứng dụng và cơ sở dữ liệu Hình 1 minh hoạ t−ơng tác giữa các ch−ơng trình ứng dụng (có chứa các câu lệnh DML) và cơ sở dữ liệu. Thực hiện một câu lệnh DML t−ơng ứng với một thủ tục của DBMS truy nhập cơ sở dữ liệu. Thủ tục lấy dữ liệu từ cơ sở dữ liệu đ−a tới vùng làm việc của ứng dụng (t−ơng ứng với câu lệnh retrieval), chuyển dữ liệu từ vùng làm việc vào cơ sở dữ liệu (t−ơng ứng với các câu lệnh insert, update), hay xoá dữ liệu khỏi cơ sở dữ liệu (câu lệnh delete). 2.2 Các mức mô tả dữ liệu DBMS mô tả dữ liệu theo nhiều mức khác nhau. Mỗi mức cung cấp một mức trừu t−ợng về cơ sở dữ liệu. Trong DBMS có thể có các mức mô tả sau: Khung nhìn logíc (Logical view) Việc xây dựng các khung nhìn tuỳ thuộc các yêu cầu của mô hình logíc và các mục đích của ứng dụng. Khung nhìn lôgíc mô tả một phần l−ợc đồ cơ sở dữ liệu lôgíc. Nói chung, ng−ời ta th−ờng sử dụng DDL để định nghĩa các khung nhìn lôgíc, DML để thao tác trên các khung nhìn này. 6
  8. L−ợc đồ dữ liệu lôgíc ở mức này, mọi dữ liệu trong cơ sở dữ liệu đ−ợc mô tả bằng mô hình lôgíc của DBMS. Các dữ liệu và quan hệ của chúng đ−ợc mô tả thông qua DDL của DBMS . Các thao tác khác nhau trên l−ợc đồ lôgíc đ−ợc xác định thông qua DML của DBMS đó. L−ợc đồ dữ liệu vật lý Mức này mô tả cấu trúc l−u trữ dữ liệu trong các file trên bộ nhớ ngoài. Dữ liệu đ−ợc l−u trữ d−ới dạng các bản ghi (có độ dài cố định hay thay đổi) và các con trỏ trỏ tới bản ghi. Trong mô tả dữ liệu, DBMS cho phép các mức khác nhau hỗ trợ độc lập lôgíc và độc lập vật lý. Độc lập lôgíc có nghĩa là: một l−ợc đồ lôgíc có thể đ−ợc sửa đổi mà không cần sửa đổi các ch−ơng trình ứng dụng làm việc với l−ợc đồ này. Trong tr−ờng hợp này, mọi thay đổi trên l−ợc đồ lôgíc cần đ−ợc thay đổi lại trên các khung nhìn lôgíc có liên quan với l−ợc đồ đó. Độc lập vật lý có nghĩa là: một l−ợc đồ vật lý có thể đ−ợc thay đổi mà không cần phải thay đổi các ứng dụng truy nhập dữ liệu đó. Đôi khi, còn có nghĩa là: các cấu trúc l−u trữ dữ liệu vật lý có thể thay đổi mà không làm ảnh h−ởng đến việc mô tả l−ợc đồ dữ liệu lôgíc. 3. Vấn đề an toàn trong cơ sở dữ liệu 3.1 Các hiểm hoạ đối với an toàn cơ sở dữ liệu Một hiểm hoạ có thể đ−ợc xác định khi đối ph−ơng (ng−ời, hoặc nhóm ng−ời) sử dụng các kỹ thuật đặc biệt để tiếp cận nhằm khám phá, sửa đổi trái phép thông tin quan trọng do hệ thống quản lý. Các xâm phạm tính an toàn cơ sở dữ liệu bao gồm đọc, sửa, xoá dữ liệu trái phép. Thông qua những xâm phạm này, đối ph−ơng có thể: ‰ Khai thác dữ liệu trái phép thông qua suy diễn thông tin đ−ợc phép. ‰ Sửa đổi dữ liệu trái phép. ‰ Từ chối dịch vụ hợp pháp. 7
  9. Các hiểm hoạ an toàn có thể đ−ợc phân lớp, tuỳ theo cách thức xuất hiện của chúng, là hiểm hoạ có chủ ý và vô ý (ngẫu nhiên). Hiểm hoạ ngẫu nhiên là các hiểm hoạ thông th−ờng độc lập với các điều khiển gây phá hỏng cơ sở dữ liệu, chúng th−ờng liên quan tới các tr−ờng hợp sau: ‰ Các thảm hoạ trong thiên nhiên, chẳng hạn nh− động đất, hoả hoạn, lụt lội có thể phá hỏng các hệ thống phần cứng, hệ thống l−u giữ số liệu, dẫn đến các xâm phạm tính toàn vẹn và sẵn sàng của hệ thống. ‰ Các lỗi phần cứng hay phần mềm có thể dẫn đến việc áp dụng các chính sách an toàn không đúng, từ đó cho phép truy nhập, đọc, sửa đổi dữ liệu trái phép, hoặc từ chối dịch vụ đối với ng−ời dùng hợp pháp. ‰ Các sai phạm vô ý do con ng−ời gây ra, chẳng hạn nh− nhập dữ liệu đầu vào không chính xác, hay sử dụng các ứng dụng không đúng, hậu quả cũng t−ơng tự nh− các nguyên nhân do lỗi phần mềm hay lỗi kỹ thuật gây ra. Những xâm phạm trên liên quan đến hai lớp ng−ời dùng sau: ‰ Ng−ời dùng đ−ợc phép là ng−ời có thể lạm dụng quyền, sử dụng v−ợt quá quyền hạn đ−ợc phép của họ. ‰ Đối ph−ơng là ng−ời, hay nhóm ng−ời truy nhập thông tin trái phép, có thể là những ng−ời nằm ngoài tổ chức hay bên trong tổ chức. Họ tiến hành các hành vi phá hoại phần mềm cơ sở dữ liệu hay phần cứng của hệ thống, hoặc đọc ghi dữ liệu trái phép. Trong cả hai tr−ờng hợp trên, họ đều thực hiện với chủ ý rõ ràng. 3.2 Các yêu cầu bảo vệ cơ sở dữ liệu Bảo vệ cơ sở dữ liệu khỏi các hiểm hoạ, có nghĩa là bảo vệ tài nguyên, đặc biệt là dữ liệu khỏi các thảm hoạ, hoặc truy nhập trái phép. Các yêu cầu bảo vệ cơ sở dữ liệu gồm: Bảo vệ chống truy nhập trái phép Đây là một vấn đề cơ bản, bao gồm trao quyền truy nhập cơ sở dữ liệu cho ng−ời dùng hợp pháp. Yêu cầu truy nhập của ứng dụng, hoặc ng−ời dùng phải đ−ợc DBMS kiểm tra. Kiểm soát truy nhập cơ sở dữ liệu phức tạp hơn kiểm soát truy 8
  10. nhập file. Việc kiểm soát cần tiến hành trên các đối t−ợng dữ liệu ở mức thấp hơn mức file (chẳng hạn nh− các bản ghi, các thuộc tính và các giá trị). Dữ liệu trong cơ sở dữ liệu th−ờng có quan hệ với nhau về ngữ nghĩa, do đó cho phép ng−ời sử dụng có thể biết đ−ợc giá trị của dữ liệu mà không cần truy nhập trực tiếp, bằng cách suy diễn từ các giá trị đã biết. Bảo vệ chống suy diễn Suy diễn là khả năng có đ−ợc các thông tin bí mật từ những thông tin không bí mật. Đặc biệt, suy diễn ảnh h−ởng tới các cơ sở dữ liệu thống kê, trong đó ng−ời dùng không đ−ợc phép dò xét thông tin của các cá thể khác từ các dữ liệu thống kê đó. Bảo vệ toàn vẹn cơ sở dữ liệu Yêu cầu này bảo vệ cơ sở dữ liệu khỏi các truy nhập trái phép mà có thể dẫn đến việc thay đổi nội dung dữ liệu. Các lỗi, virus, hỏng hóc trong hệ thống có thể gây hỏng dữ liệu. DBMS đ−a ra dạng bảo vệ này, thông qua các kiểm soát về sự đúng đắn của hệ thống, các thủ tục sao l−u, phục hồi và các thủ tục an toàn đặc biệt. Để duy trì tính t−ơng thích của cơ sở dữ liệu, mỗi giao tác phải là một đơn vị tính toán tin cậy và t−ơng thích. Hệ thống khôi phục (recovery system) sử dụng nhật ký. Với mỗi giao tác, nhật ký ghi lại các phép toán đã đ−ợc thực hiện trên dữ liệu (chẳng hạn nh− read, write, delete, insert), cũng nh− các phép toán điều khiển giao tác (chẳng hạn nh− commit, abort), cả giá trị cũ và mới của các bản ghi kéo theo. Hệ thống phục hồi đọc file nhật ký để xác định giáo tác nào bị huỷ bỏ và giao tác nào cần phải thực hiện lại. Huỷ một giao tác có nghĩa là phục hồi lại giá trị cũ của mỗi phép toán trên bản ghi kéo theo. Thực hiện lại giao tác có nghĩa là cập nhật giá trị mới của mỗi phép toán vào bản ghi kéo theo. Các thủ tục an toàn đặc biệt bảo vệ dữ liệu không bị truy nhập trái phép. Xây dựng mô hình, thiết kế và thực hiện các thủ tục này là một trong các mục tiêu an toàn cơ sở dữ liệu. Toàn vẹn dữ liệu thao tác 9
  11. Yêu cầu này đảm bảo tính t−ơng thích lôgíc của dữ liệu khi có nhiều giao tác thực hiện đồng thời. Bộ quản lý t−ơng tranh trong DBMS đảm bảo tính chất khả tuần tự và cô lập của các giao tác. Khả tuần tự có nghĩa là kết quả của việc thực hiện đồng thời một tập hợp các giao tác giống với việc thực hiện tuần tự các giao tác này. Tính cô lập để chỉ sự độc lập giữa các giao tác, tránh đ−ợc hiệu ứng Domino, trong đó việc huỷ bỏ một giao tác dẫn đến việc huỷ bỏ các giao tác khác (theo kiểu thác đổ). Vấn đề đảm bảo truy nhập đồng thời vào cùng một thực thể dữ liệu, từ các giao tác khác nhau, nh−ng không làm ảnh h−ởng đến tính t−ơng thích của dữ liệu, đ−ợc giải quyết bằng các kỹ thuật khoá. Các kỹ thuật khoá và giải phóng khoá đ−ợc thực hiện theo nguyên tắc: khoá các mục dữ liệu trong một khoảng thời gian cần thiết để thực hiện phép toán và giải phóng khoá khi phép toán đã hoàn tất. Tuy nhiên kỹ thuật này không đảm bảo tính khả tuần tự. Nh−ợc điểm này đ−ợc khắc phục bằng cách sử dụng kỹ thuật khoá hai pha. Toàn vẹn ngữ nghĩa của dữ liệu Yêu cầu này đảm bảo tính t−ơng thích lôgíc của các dữ liệu bị thay đổi, bằng cách kiểm tra các giá trị dữ liệu có nằm trong khoảng cho phép hay không. Các hạn chế (trên các giá trị dữ liệu) đ−ợc biểu diễn nh− là các ràng buộc toàn vẹn. Các ràng buộc có thể đ−ợc xác định trên toàn bộ cơ sở dữ liệu hoặc là cho một số các giao tác. Khả năng l−u vết và kiểm tra Yêu cầu này bao gồm khả năng ghi lại mọi truy nhập tới dữ liệu (với các phép toán read và write). Khả năng kiểm tra và l−u vết đảm bảo tính toàn vẹn dữ liệu vật lý và trợ giúp cho việc phân tích dãy truy nhập vào cơ sở dữ liệu. Xác thực ng−ời dùng Yêu cầu này thực sự cần thiết để xác định tính duy nhất của ng−ời dùng. Định danh ng−ời dùng làm cơ sở cho việc trao quyền. Ng−ời dùng đ−ợc phép truy nhập dữ liệu, khi hệ thống xác định đ−ợc ng−ời dùng này là hợp pháp. 10
  12. Quản lý và bảo vệ dữ liệu nhạy cảm Có những cơ sở dữ liệu chứa nhiều dữ liệu nhạy cảm (là những dữ liệu không nên đ−a ra công bố công khai). Có những cơ sở dữ liệu chỉ chứa các dữ liệu nhạy cảm, chẳng hạn nh− dữ liệu quân sự, còn có các cơ sở dữ liệu mang tính công cộng, chẳng hạn nh− các cơ sở dữ liệu của th− viện. Các cơ sở dữ liệu bao gồm cả thông tin nhạy cảm và thông tin th−ờng cần phải có các chính sách quản lý phức tạp hơn. Một mục dữ liệu là nhạy cảm khi chúng đ−ợc ng−ời quản trị cơ sở dữ liệu (DBA) khai báo là nhạy cảm. Kiểm soát truy nhập vào các cơ sở dữ liệu bao hàm: bảo vệ tính tin cậy của dữ liệu nhậy cảm và chỉ cho phép ng−ời dùng hợp pháp truy nhập vào. Những ng−ời dùng này đ−ợc trao một số quyền thao tác nào đó trên dữ liệu và không đ−ợc phép lan truyền chúng. Do vậy, ng−ời dùng có thể truy nhập vào các tập con dữ liệu nhạy cảm. Bảo vệ nhiều mức Bảo vệ nhiều mức bao gồm một tập hợp các yêu cầu bảo vệ. Thông tin có thể đ−ợc phân loại thành nhiều mức khác nhau, ví dụ các cơ sở dữ liệu quân sự cần đ−ợc phân loại chi tiết hơn (mịn hơn) các cơ sở dữ liệu thông th−ờng, có thể có nhiều mức nhạy cảm khác nhau. Mục đích của bảo vệ nhiều mức là phân loại các mục thông tin khác nhau, đồng thời phân quyền cho các mức truy nhập khác nhau vào các mục riêng biệt. Một yêu cầu nữa đối với bảo vệ nhiều mức là khả năng gán mức cho các thông tin. Sự hạn chế Mục đích của việc hạn chế là tránh chuyển các thông tin không mong muốn giữa các ch−ơng trình trong hệ thống, ví dụ chuyển dữ liệu quan trọng tới các ch−ơng trình không có thẩm quyền. Các kênh đ−ợc phép cung cấp thông tin thông qua các hoạt động đ−ợc phép, nh− soạn thảo hay biên dịch một file. Kênh bộ nhớ là các vùng bộ nhớ, nơi một ch−ơng trình có thể l−u giữ dữ liệu, các ch−ơng trình khác cũng có thể đọc dữ liệu này. Kênh ngầm là kênh truyền thông dựa trên việc sử dụng tài nguyên mà không có ý định truyền thông giữa các tiến trình của hệ thống. 4. Kiểm soát an toàn 11
  13. Có thể bảo vệ đ−ợc cơ sở dữ liệu thông qua các ph−ơng pháp an toàn sau: ‰ Kiểm soát luồng ‰ Kiểm soát suy diễn ‰ Kiểm soát truy nhập Với các kiểm soát này, kỹ thuật mật mã có thể đ−ợc đ−a vào để mã hoá dữ liệu với khoá mã bí mật. Thông qua kỹ thuật này, bí mật của thông tin đ−ợc bảo đảm, bằng cách tạo ra dữ liệu mà ai cũng có thể nhìn đ−ợc nh−ng chỉ ng−ời dùng hợp pháp mới hiểu đ−ợc . 4.1 Kiểm soát luồng Các kiểm soát luồng điều chỉnh phân bố luồng thông tin giữa các đối t−ợng có khả năng truy nhập. Một luồng giữa đối t−ợng X và đối t−ợng Y xuất hiện khi có một lệnh đọc (read) giá trị từ X và ghi (write) giá trị vào Y. Kiểm soát luồng là kiểm tra xem thông tin có trong một số đối t−ợng có chảy vào các đối t−ợng có mức bảo vệ thấp hơn hay không. Các chính sách kiểm soát luồng cần phải chỉ ra các luồng có thể đ−ợc chấp nhận, hoặc phải điều chỉnh. Thông th−ờng, trong kiểm soát luồng ng−ời ta phải tính đến việc phân loại các phần tử của hệ thống, đó là các đối t−ợng và chủ thể. Các phép toán đ−ợc phép (read và write) dựa trên quan hệ giữa các lớp. Phép toán read đối t−ợng có mức bảo vệ cao hơn bị kiểm soát nhiều hơn. Kiểm soát luồng ngặn chặn việc chuyển thông tin vào các mức dễ truy nhập hơn. Vấn đề của chính sách kiểm soát luồng đ−ợc giải quyết bằng cách xác định các phép toán cho phép chuyển thông tin tới các mức thấp hơn mà vẫn giữ nguyên đ−ợc mức nhạy cảm của những đối t−ợng này. 4.2 Kiểm soát suy diễn Kiểm soát suy diễn nhằm mục đích bảo vệ dữ liệu không bị khám phá gián tiếp. Kênh suy diễn là kênh mà ở đó ng−ời dùng có thể tìm thấy mục dữ liệu X, sau đó sử dụng X để suy ra mục dữ liệu Y, thông qua Y=f(X). Các kênh suy diễn chính trong hệ thống là: 12
  14. (1) Truy nhập gián tiếp: điều này xảy ra khi ng−ời (không đ−ợc trao quyền) khám phá ra bộ dữ liệu Y thông qua các câu hỏi truy vấn đ−ợc phép trên dữ liệu X, cùng với các điều kiện trên Y. (2) Dữ liệu t−ơng quan: Dữ liệu t−ơng quan là một kênh suy diễn đặc tr−ng, xảy ra khi dữ liệu có thể nhìn thấy đ−ợc X và dữ liệu không thể nhìn thấy đ−ợc Y kết nối với nhau mặt ngữ nghĩa. Kết quả là có thể khám phá đ−ợc thông tin về Y nhờ đọc X. (3) Thiếu dữ liệu: Kênh thiếu dữ liệu là một kênh suy diễn mà qua đó, ng−ời dùng có thể biết đ−ợc sự tồn tại của một tập giá trị X. Đặc biệt, ng−ời dùng có thể tìm đ−ợc tên của đối t−ợng, mặc dù họ không đ−ợc phép truy nhập vào thông tin chứa trong đó. Suy diễn thống kê là một khía cạnh khác của suy diễn dữ liệu. Trong các cơ sở dữ liệu thống kê, ng−ời dùng không đ−ợc phép truy nhập vào các dữ liệu đơn lẻ, chỉ đ−ợc phép truy nhập vào dữ liệu thông qua các hàm thống kê. Tuy nhiên với một ng−ời có kinh nghiệm, anh ta vẫn có thể khám phá đ−ợc dữ liệu thông qua các thống kê đó. 4.3 Kiểm soát truy nhập Kiểm soát truy nhập trong các hệ thống thông tin là đảm bảo mọi truy nhập trực tiếp vào các đối t−ợng của hệ thống tuân theo các kiểu và các quy tắc đã đ−ợc xác định trong chính sách bảo vệ. Một hệ thống kiểm soát truy nhập (hình 2) bao gồm các chủ thể (ng−ời dùng, tiến trình) truy nhập vào đối t−ợng (dữ liệu, ch−ơng trình) thông qua các phép toán read, write, run. Truy nhập bị từ chối Yêu cầu Các thủ tục Truy nhập truy nhập kiểm soát đ−ợc phép Sửa đổi yêu cầu Các chính Các quy sách an toàn tắc truy nhập 13
  15. Hình 2 Hệ thống kiểm soát truy nhập Xét về mặt chức năng, nó bao gồm hai thành phần: 1) Tập các chính sách và quy tắc truy nhập: bao gồm các thông tin về chế độ truy nhập mà các chủ thể có thể có đ−ợc khi truy nhập các đối t−ợng. 2) Tập các thủ tục kiểm soát (các kỹ thuật an toàn): Kiểm tra các câu hỏi (các yêu cầu truy nhập) dựa vào các quy tắc đã đ−ợc xác định (quá trình phê chuẩn câu hỏi); các câu hỏi này có thể đ−ợc phép, bị từ chối hoặc bị sửa đổi. Các chính sách an toàn Chính sách an toàn của hệ thống là các h−ớng dẫn ở mức cao, có liên quan đến việc thiết kế và quản lý hệ thống trao quyền. Nhìn chung, chúng biểu diễn các lựa chọn cơ bản nhằm đảm bảo mục tiêu an toàn dữ liệu. Chính sách an toàn định nghĩa các nguyên tắc, trong đó quy định truy nhập nào đ−ợc trao hoặc bị từ chối. Các quy tắc trao quyền (quy tắc truy nhập) là các biểu diễn của chính sách an toàn; Chúng quyết định hành vi của hệ thống trong thời gian chạy. Các chính sách an toàn nên xác định: làm thế nào để quản lý đ−ợc tập các quy tắc quyền (chèn và sửa đổi). Sau đây là một ví dụ về chính sách an toàn. Trong vấn đề giới hạn truy nhập, một câu hỏi đặt ra là "Mỗi chủ thể có đ−ợc phép truy nhập bao nhiêu thông tin". Chúng ta có hai chính sách sau đây: 1) Chính sách đặc quyền tối tiểu: còn đ−ợc gọi là chính sách "cần - để - biết" (need-to-know). Theo chính sách này, các chủ thể của hệ thống nên sử dụng một l−ợng thông tin tối thiểu cần cho hoạt động của chúng. Đôi khi, việc −ớc tính l−ợng thông tin tối thiểu này là rất khó. Điểm hạn chế của chính sách này đ−a ra các hạn chế khá lớn và vô ích đối với các chủ thể vô hại. 2) Chính sách đặc quyền tối đa: dựa vào nguyên tắc "khả năng sẵn sàng tối đa" của dữ liệu, vì vậy mức độ chia xẻ là cực đại. Chính sách này phù hợp với các môi tr−ờng (chẳng hạn nh− tr−ờng đại học, trung tâm nghiên cứu), việc bảo vệ nghiêm ngặt tại những nơi này thực sự không cần thiết, do các yêu cầu về độ tin cậy ng−ời dùng và trao đổi dữ liệu. 14
  16. Trong một hệ thống khép kín, chỉ cho phép các truy nhập đ−ợc phép. Trong một hệ thống mở, cho phép các truy nhập không bị cấm. Chính sách của một hệ thống khép kín chỉ rõ, với mỗi chủ thể: các quy tắc trao quyền hiện có xác định các đặc quyền truy nhập mà chủ thể đó có đ−ợc trên các đối t−ợng của hệ thống. Đây là những quyền mà chủ thể đ−ợc trao, thông qua cơ chế kiểm soát. Chính sách của một hệ thống mở chỉ rõ, đối với mỗi chủ thể: các quy tắc trao quyền hiện có xác định các đặc quyền mà chủ thể không nắm giữ trên các đối t−ợng của hệ thống. Đây là những quyền mà chủ thể bị từ chối, thông qua cơ chế kiểm soát. Khi việc quyết định dựa vào các chiến l−ợc an toàn, sự lựa chọn phụ thuộc vào các đặc điểm và yêu cầu của môi tr−ờng, ng−ời dùng, ứng dụng,.v.v. Một hệ thống khép kín tuân theo chính sách đặc quyền tối thiểu, trong khi đó hệ thống mở tuân theo chính sách đặc quyền tối đa. Việc bảo vệ trong các hệ thống khép kín cao hơn. Các lỗi (chẳng hạn nh− một quy tắc thiếu) có thể từ chối truy nhập đ−ợc phép, nh−ng điều này không gây thiệt hại, ng−ợc lại trong các hệ thống mở, điều này có thể dẫn đến việc trao các truy nhập trái phép. Các hệ thống khép kín cho phép đánh giá tình trạng trao quyền dễ dàng hơn, vì các đặc quyền do ng−ời dùng nắm giữ, chính vì vậy, kiểu hệ thống này th−ờng đ−ợc lựa chọn nhiều hơn. Tuy nhiên, việc chọn lựa cũng phụ thuộc vào dạng môi tr−ờng và các yêu cầu bảo vệ. Các kiểm soát truy nhập (tùy thuộc vào chính sách của các hệ thống khép kín và mở) đ−ợc minh hoạ trong hình 3 và 4. 15
  17. Yêu cầu truy nhập Các quy Có quy tắc cho phép tắc: các truy nhập? truy nhập đ−ợc phép Có Không Truy nhập Truy nhập đ−ợc phép bị từ chối Hình 3 Kiểm soát truy nhập trong các hệ thống khép kín Trong một hệ thống an toàn, việc định nghĩa các chính sách quản lý quyền là xác định "ai" có thể trao quyền hoặc huỷ bỏ quyền truy nhập. Việc trao và huỷ bỏ không phải lúc nào cũng thuộc quyền của ng−ời trao quyền hoặc nhân viên an ninh. Đôi khi, việc quản lý trao quyền đòi hỏi sự tham gia của nhiều ng−ời khác nhau. Đây là một đặc thù của hệ thống phân tán, trong đó các hệ thống cục bộ khác nhau th−ờng đ−ợc quản lý tự trị. Điều này cũng xảy ra trong các hệ thông tin lớn, cơ sở dữ liệu đ−ợc phân hoạch lôgíc thành các cơ sở dữ liệu khác nhau, mỗi phần đ−ợc một DBA địa ph−ơng quản lý. Yêu cầu truy nhập 16 Các quy Có quy tắc từ chối tắc: các truy nhập? truy nhập bị cấm Không Có
  18. Hình 4 Kiểm soát truy nhập trong các hệ thống mở Sự lựa chọn giữa quản lý tập trung và phi tập trung là một chính sách an toàn. Tuy nhiên, có thể có các chính sách trung gian, ví dụ: • Trao quyền phi tập trung phân cấp: trong đó, ng−ời trao quyền trung tâm có trách nhiệm chia nhỏ trách nhiệm quản trị cơ sở dữ liệu cho những ng−ời quản trị cấp d−ới. Ví dụ, ng−ời trao quyền trung tâm có thể chỉ định hoặc không sử dụng ng−ời quản trị cấp d−ới của anh ta. • Quyền sở hữu : ng−ời tạo ra đối t−ợng (ví dụ, một bảng trong cơ sở dữ liệu quan hệ) là ng−ời sở hữu đối t−ợng đó (điều này là mặc định). Do vậy, anh ta có quyền trao hoặc huỷ bỏ truy nhập tới đối t−ợng đó, đôi khi cần có sự đồng ý của ng−ời quản trị trung tâm. • Quyền hợp tác: Việc trao các quyền đặc biệt trên một số tài nguyên nào đó không thể chỉ do một ng−ời quyết định mà phải có sự đồng ý của một nhóm ng−ời dùng xác định. Các chính sách kiểm soát truy nhập: xác định cách thức nhóm các chủ thể và các đối t−ợng của hệ thống để chia xẻ các chế độ truy nhập tuỳ thuộc vào các quyền và các quy tắc định tr−ớc. Hơn nữa, chính sách xác định các quyền truy nhập có thể đ−ợc chuyển và chuyển nh− thế nào. Những ng−ời dùng (trong cùng một nhóm, hoặc cùng mức phân loại) có một số đặc quyền, hoặc tài nguyên (có các yêu cầu bảo vệ chung) đơn giản hoá việc đặc tả các chính sách an toàn và việc thực thi các cơ chế an toàn. Vì vậy, ng−ời ta đã đề xuất nhiều tiêu chuẩn nhóm khác nhau, chẳng hạn nh−: 17
  19. - Mức thiết kế: phân hoạch ng−ời dùng. - Mức thực thi: cách thức quản lý việc chuyển ng−ời dùng giữa các mức khác nhau. Các kiểm soát truy nhập đ−ợc ánh xạ vào các kiểm soát luồng thông tin giữa các mức khác nhau. Thủ tục này đ−ợc sử dụng rộng rãi trong các hệ thống an toàn đa mức trong quân sự, trong đó các chính sách kiểm soát truy nhập thực chất là các chính sách kiểm soát luồng thông tin. Các hệ thống đa mức đã thành công, do chúng đ−ợc xây dựng trên các mô hình an toàn đ−ợc nghiên cứu đầy đủ về mặt lý thuyết. Kiểm soát truy nhập bắt buộc (MAC) hạn chế truy nhập của các chủ thể vào các đối t−ợng, bằng cách sử dụng các nhãn an toàn. Kiểm soát truy nhập tuỳ ý (DAC) cho phép lan truyền các quyền truy nhập từ chủ thể này đến chủ thể khác. Chính sách bắt buộc trong kiểm soát truy nhập đ−ợc áp dụng cho các thông tin có yêu cầu bảo vệ nghiêm ngặt, trong các môi tr−ờng mà ở đó dữ liệu hệ thống có thể đ−ợc phân loại và ng−ời dùng đ−ợc xác định rõ ràng. Chính sách bắt buộc cũng có thể đ−ợc định nghĩa nh− là một chính sách kiểm soát luồng, bởi vì nó ngăn chặn dòng thông tin chảy vào các đối t−ợng có mức phân loại thấp hơn. Chính sách bắt buộc quyết định truy nhập vào dữ liệu, thông qua việc định nghĩa các lớp an toàn của chủ thể và đối t−ợng. Hai đặc điểm chính của lớp đối t−ợng an toàn là: mức phân loại phản ánh thông tin có trong đó và loại (vùng ứng dụng) mà thông tin đối t−ợng đề cập đến. Ví dụ, các mức phân loại nh− sau: 0= Thông th−ờng 1= Mật 2= Tuyệt mật 3= Tối mật Loại phản ánh các vùng của hệ thống, hoặc các bộ phận của tổ chức. Với m vùng hệ thống, có thể chia tối đa thành 2m loại. Mỗi chủ thể và đối t−ợng đ−ợc gán một lớp an toàn, bao gồm một mức nhạy cảm và một tập hợp các loại. Phân loại các chủ thể phản ánh mức độ tin cậy có thể đ−ợc 18
  20. gán cho chủ thể đó và vùng ứng dụng mà nó làm việc. Phân loại đối t−ợng phản ánh mức độ nhạy cảm của thông tin có trong đối t−ợng. Một tập hợp các tiên đề xác định các quan hệ đ−ợc kiểm tra giữa lớp chủ thể và lớp đối t−ợng, cho phép các chủ thể truy nhập vào các đối t−ợng theo tiêu chuẩn an toàn. Những quan hệ này phụ thuộc vào chế độ truy nhập. Về việc chuyển giao quyền truy nhập, không thể thay đổi các quyền đã đ−ợc gán, mọi thay đổi chỉ đ−ợc phép khi có sự đồng ý của ng−ời trao quyền. Điều này có nghĩa là, ng−ời trao quyền kiểm soát toàn bộ hệ thống trao quyền. Kiểm soát truy nhập thông qua các chính sách bắt buộc đ−ợc minh hoạ trong hình 5. 19
  21. Các tiên đề an toàn Yêu cầu truy nhập Yêu cầu thoả mãn các tiên đề của chính sách Các lớp an bắt buộc? toàn của chủ thể/đối t−ợng Có Không Truy nhập Truy nhập đ−ợc phép bị từ chối Hình 5 Kiểm soát truy nhập bắt buộc Chính sách tùy ý chỉ rõ những đặc quyền mà mỗi chủ thể có thể có đ−ợc trên các đối t−ợng của hệ thống. Các yêu cầu truy nhập đ−ợc kiểm tra, thông qua một cơ chế kiểm soát tuỳ ý, truy nhập chỉ đ−ợc trao cho các chủ thể thoả mãn các quy tắc trao quyền hiện có (hình 6). Yêu cầu truy nhập Các quy tắc trao quyền Yêu cầu thoả mãn các quy tắc trao quyền? Không Có Truy nhập Tân từ 'P' của đ−ợc phép quy tắc đ−ợc thoả mãn? Không Có Truy nhập Truy nhập đ−ợc phép bị từ chối Hình 6 Kiểm soát truy nhập tuỳ ý 20
  22. Chính sách tuỳ ý dựa vào định danh của ng−ời dùng có yêu cầu truy nhập. Điều này ngầm định rằng, việc phân quyền kiểm soát dựa vào quyền sở hữu. Tuy nhiên, chính sách tuỳ ý cũng phù hợp với quản trị tập trung. Trong tr−ờng hợp này, quyền đ−ợc ng−ời quản trị hệ thống quản lý: quản trị phi tập trung ý muốn nói đến các chính sách kiểm soát tuỳ ý. Chính sách tuỳ ý cần các cơ chế trao quyền phức tạp hơn, nhằm tránh mất quyền kiểm soát khi lan truyền quyền từ ng−ời trao quyền, hoặc những ng−ời có trách nhiệm khác. Sự thu hồi quyền đã đ−ợc lan truyền là một vấn đề khác. Với mỗi quyền bị thu hồi, ng−ời dùng (ng−ời đã đ−ợc trao hoặc nhận quyền đó) phải đ−ợc hệ thống nhận dạng (xác định). Hiện tồn tại nhiều chính sách thu hồi khác nhau cho mục đích này. DAC có nh−ợc điểm sau: nó cho phép đọc thông tin từ một đối t−ợng và chuyển đến một đối t−ợng khác mà có thể đ−ợc ghi bởi chủ thể; Các chính sách bắt buộc và tuỳ ý là không loại trừ lẫn nhau. Chúng có thể đ−ợc kết hợp với nhau: chính sách bắt buộc đ−ợc áp dụng cho kiểm soát trao quyền, trong khi đó chính sách tuỳ ý đ−ợc áp dụng cho kiểm soát truy nhập. Các quy tắc trao quyền Nh− đã trình bày ở trên, nhiệm vụ của ng−ời cấp quyền là chuyển đổi các yêu cầu và các chính sách an toàn thành các quy tắc trao quyền. Thông th−ờng, tổ chức xác định các yêu cầu an toàn và ng−ời dùng nhận biết chúng thông qua kinh nghiệm của họ. Các quy tắc trao quyền đ−ợc biểu diễn đúng với môi tr−ờng phần mềm/phần cứng của hệ thống bảo vệ và các chính sách an toàn đ−ợc chấp thuận. Quá trình thiết kế một hệ thống an toàn phải đ−a ra đ−ợc một mô hình và mô hình này hỗ trợ ng−ời trao quyền khi ánh xạ các yêu cầu vào các quy tắc, tuỳ theo các chính sách an toàn cần quan tâm (Hình 7). 21
  23. Mô hình an Các yêu cầu và Môi tr−ờng toàn chính sách an toàn ứng dụng Các quy tắc trao quyền Hình 7 Thiết kế các quy tắc trao quyền Một ví dụ về ma trận quyền đ−ợc trình bày trong bảng 1, trong đó R= Read, W= Write, EXC= Execute, CR= Create, và DEL= Delete. Đây là một tr−ờng hợp kiểm soát truy nhập đơn giản dựa vào tên đối t−ợng, đ−ợc gọi là truy nhập phụ thuộc tên (name-dependent access). Các quyền có thể bao gồm nhiều quy tắc an toàn phức tạp hơn, chúng xác định các ràng buộc truy nhập giữa chủ thể và đối t−ợng. Một tân từ (predicate) cũng có thể đ−ợc xem là biểu thức của một số biến hệ thống, chẳng hạn nh− ngày, giờ và nguồn truy vấn, vì vậy đã thiết lập cơ sở cho kiểm soát phụ thuộc ngữ cảnh (context- dependent control). Một ví dụ về kiểm soát phụ thuộc ngữ cảnh là không thể truy nhập vào thông tin đ−ợc phân loại thông qua một đăng nhập từ xa (remote login), hoặc chỉ cập nhật thông tin về l−ơng vào thời điểm cuối của năm. Kiểm soát phụ thuộc nội dung (content-dependent control) nằm ngoài phạm vi của các hệ điều hành, do DBMS cung cấp. Với kiểm soát phụ thuộc ngữ cảnh (context-dependent control), một phần do hệ điều hành cung cấp, một phần do DBMS cung cấp. 22
  24. Bảng 1 Ma trận quyền Đối t−ợng Chủ thể File F1 File F2 File F3 Ng−ời dùng 1 R,W EXEC EXEC Ng−ời dùng 2 - - CR, DEL Ch−ơng trình P1 R,W R - Các quy tắc an toàn cũng nên xác định các kết hợp dữ liệu không đ−ợc phép, cần phải xem độ nhạy cảm của dữ liệu có tăng lên sau khi kết hợp hay không. Ví dụ, ng−ời dùng có thể đ−ợc phép đọc tên và các giá trị l−ơng của nhân viên một cách riêng lẻ, nh−ng không đ−ợc phép đọc kết hợp "tên - l−ơng", nếu không họ có thể liên hệ l−ơng với từng nhân viên cụ thể. Việc truy nhập vào các ch−ơng trình xử lý dữ liệu (ví dụ, một số ch−ơng trình hệ thống hoặc ứng dụng) cũng cần đ−ợc kiểm soát. Các vấn đề và cơ chế liên quan đến việc bảo vệ dữ liệu cần đ−ợc mở rộng, nhằm giải quyết các vấn đề phức tạp hơn về bảo vệ logíc tất cả tài nguyên hệ thống. Với các chính sách tuỳ ý, việc trao hoặc huỷ bỏ quyền truy nhập phụ thuộc vào một vài ng−ời trao quyền, một quy tắc an toàn có thể là bộ 6 { a, s, o, t, p ,f}, trong đó a là ng−ời trao quyền, s là chủ thể đ−ợc trao quyền {o, t, p}, f là cờ sao chép (copy flag) mô tả khả năng s chuyển quyền {o, t, p} cho các chủ thể khác. Các chính sách an toàn (liên quan đến việc chuyển quyền truy nhập) quyết định sự xuất hiện của cờ này, cũng nh− việc sử dụng nó. Ví dụ trong một vài hệ thống, cờ đ−ợc xác lập lại sau n lần trao, vì vậy cho phép chuyển quyền sâu n mức. Cơ chế an toàn Hệ thống kiểm soát truy nhập dựa vào các cơ chế an toàn là các chức năng thực hiện các quy tắc và chính sách an toàn. Các cơ chế an toàn liên quan đến việc ngăn chặn truy nhập trái phép (các cơ chế kiểm soát truy nhập) và phát hiện truy nhập trái phép (cơ chế phát hiện xâm nhập và kiểm toán). Muốn ngăn chặn và phát hiện tốt đòi hỏi các cơ chế xác thực tốt. Các cơ chế kiểm soát truy nhập đ−ợc chọn lựa nhiều hơn. Đôi khi, phát hiện là một tuỳ chọn, ví dụ khả năng giải trình việc sử 23
  25. dụng đúng đắn các đặc quyền, hoặc chống lại việc sửa đổi các thông báo trên mạng. Các cơ chế an toàn có thể đ−ợc thực thi thông qua phần cứng, phần mềm hoặc thông qua các thủ tục quản lý. Khi phát triển hệ thống an toàn, các chính sách và cơ chế nên đ−ợc tách rời để có thể: ‰ Thảo luận (một cách độc lập) các quy tắc truy nhập về các cơ chế thực hiện. Điều này cho phép các nhà thiết kế tập trung vào tính đúng đắn của các yêu cầu an toàn, cũng nh− tính t−ơng thích của các chính sách an toàn. ‰ So sánh các chính sách kiểm soát truy nhập khác nhau, hoặc các cơ chế thực hiện khác nhau cho cùng một chính sách. ‰ Thiết kế các cơ chế có khả năng thực hiện các chính sách khác nhau. Điều này cần thiết khi các chính sách cần thay đổi động, tuỳ thuộc vào sự thay đổi của môi tr−ờng ứng dụng và các yêu cầu bảo vệ. Chính sách an toàn nên có quan hệ chặt chẽ với cơ chế thực hiện. Mọi thay đổi của chính sách phải phù hợp với hệ thống kiểm soát. Để có đ−ợc các cơ chế tuân theo các chính sách (đã đ−ợc thiết kế) là một vấn đề mang tính quyết định. Trong thực tế, việc thực hiện không đúng một chính sách an toàn dẫn đến các quy tắc truy nhập không đúng, hoặc hỗ trợ không đầy đủ chính sách bảo vệ. Hai kiểu lỗi hệ thống cơ bản có thể xuất phát từ việc thực thi không đúng: (1) Từ chối truy nhập đ−ợc phép (2) Cho phép truy nhập đã bị cấm Các cơ chế bên ngoài Chúng bao gồm các biện pháp kiểm soát vật lý và quản lý, có thể ngăn ngừa truy nhập trái phép vào tài nguyên vật lý (phòng, thiết bị đầu cuối, các thiết bị khác), vì vậy chỉ cho phép các truy nhập đ−ợc phép. Ngoài ra còn có các thiết bị có khả năng bảo vệ chống lại các hiểm hoạ. Tuy nhiên, để có đ−ợc bảo vệ đầy đủ là không thể, đặc biệt trong các môi tr−ờng có tấn công hoặc xâm phạm ngẫu nhiên. Mục tiêu là giảm đến mức tối thiểu các thiệt hại. Điều này có nghĩa là: 24
  26. ‰ Giảm đến mức tối thiểu các xâm phạm; ‰ Giảm đến mức tối thiểu các thiệt hại; ‰ Cung cấp các thủ tục khôi phục. Các cơ chế bên trong Các biện pháp bảo vệ đ−ợc áp dụng khi ng−ời dùng bỏ qua, hoặc nhận đ−ợc quyền truy nhập thông qua các kiểm soát bên ngoài. Xác thực ng−ời dùng và kiểm tra tính hợp pháp của các hành động đ−ợc yêu cầu, tuỳ thuộc vào quyền của ng−ời dùng, là các hoạt động căn bản. Việc bảo vệ bên trong bao gồm 3 cơ chế cơ bản sau: 1) Xác thực (authentication): Cơ chế này ngăn chặn ng−ời dùng trái phép, bằng cách sử dụng một hệ thống kiểm tra định danh ng−ời dùng, từ: • Những thứ đã quen thuộc với ng−ời dùng (chẳng hạn nh− mật khẩu, mã); • Những thứ mà ng−ời dùng sở hữu ( chẳng hạn nh− thẻ từ, phù hiệu); • Các đặc điểm vật lý của ng−ời dùng (chẳng hạn nh− dấu vân tay, chữ ký, giọng nói); 2) Các kiểm soát truy nhập (access controls): Với kết quả xác thực là hợp lệ, các câu truy vấn (do ng−ời dùng gõ vào) có thể đ−ợc trả lời hay không, tuỳ thuộc vào các quyền mà ng−ời dùng hiện có. 3) Các cơ chế kiểm toán (auditing mechanisms): giám sát việc sử dụng tài nguyên hệ thống của ng−ời dùng. Các cơ chế này bao gồm hai giai đoạn: • Giai đoạn đăng nhập: tất cả các câu hỏi truy nhập và câu trả lời liên quan đều đ−ợc ghi lại; • Giai đoạn báo cáo: các báo cáo của giai đoạn tr−ớc đ−ợc kiểm tra, nhằm phát hiện các xâm phạm hoặc tấn công có thể xảy ra. Các cơ chế kiểm toán thích hợp cho việc bảo vệ dữ liệu, bởi vì chúng hỗ trợ: 25
  27. • Đánh giá phản ứng của hệ thống đối với một số dạng hiểm họa. Điều này cũng giúp ích cho việc phát hiện các điểm yếu của hệ thống. • Phát hiện các xâm phạm chủ ý đ−ợc thực hiện thông qua chuỗi các câu truy vấn. Hơn nữa, có thể ngăn chặn đ−ợc các xâm phạm hoặc hiểm hoạ, do ng−ời dùng đã có ý thức trong việc sử dụng các thủ tục kiểm toán (có khả năng giám sát mọi hoạt động). Hình 8 minh hoạ cấu trúc của một DBMS có các đặc tính an toàn, với các môđun và ng−ời dùng. Giả thiết rằng, việc truy nhập dữ liệu đ−ợc bảo vệ chỉ thông qua các chức năng của DBMS. Sau khi ng−ời dùng đăng nhập và đ−ợc xác thực, mỗi câu hỏi truy nhập cơ sở dữ liệu (đ−ợc tạo ra từ một trình ứng dụng) đ−ợc dàn xếp, thông qua các thủ tục của hệ thống trao quyền (AS). Chúng tham chiếu vào các file quy tắc trao quyền, kiểm tra xem các câu hỏi có tuân theo các quy tắc đó không. Truy nhập đ−ợc phép phụ thuộc vào việc đối chiếu câu hỏi- quy tắc. Mặt khác, một thông báo về tình trạng lỗi có thể đ−ợc gửi đến ng−ời dùng, và/ hoặc các xâm phạm đ−ợc AS ghi trong một file nhật ký cùng với các tham chiếu (ví dụ ngày, giờ, ng−ời dùng). Ng−ời có trách nhiệm sẽ kiểm tra file này một cách định kỳ, phát hiện ra các hành vi đáng ngờ, hoặc kiểm tra tình trạng tái diễn của các xâm phạm. Một chuyên gia, ng−ời quản trị an toàn có trách nhiệm định nghĩa các quy tắc trao quyền, xuất phát từ các yêu cầu an toàn của tổ chức. Ng−ời trao quyền cũng có thể là ng−ời kiểm toán và/ hoặc DBA. Các câu hỏi truy nhập (đ−ợc phép) đ−ợc biên dịch thành các lời gọi ch−ơng trình từ th− viện ứng dụng, sau đó đ−ợc bộ quản lý giao tác xử lý và chuyển thành các yêu cầu truy nhập dữ liệu (do bộ quản lý dữ liệu xử lý). Hơn nữa, hệ điều hành và phần cứng có thể đ−a ra các kiểm soát (chẳng hạn nh− kiểm soát truy nhập file) để đảm bảo rằng dữ liệu đ−ợc chuyển chính xác tới vùng ng−ời dùng yêu cầu. Kỹ thuật mật mã và các bản sao dự phòng là ph−ơng tiện th−ờng đ−ợc sử dụng khi bảo vệ hệ thống l−u giữ ch−ơng trình và dữ liệu vật lý. 26
  28. Profile của Đăng nhập ng−ời dùng Ng−ời dùng Xác thực File nhật ký Xử lý dữ liệu lô/các câu truy vấn trực tuyến Kiểm toán viên Các tiên Hệ thống Các quy DBA trao quyền đề an tắc trao toàn quyền Các l−ợc đồ cơ sở dữ liệu : • Các khung Ng−ời quản trị nhìn an toàn (ng−ời • L−ợc đồ lôgíc trao quyền) • L−ợc đồ bên Bộ quản Bộ quản lý trong lý dữ liệu giao tác Ng−ời lập Các ch−ơng trình trình ứng dụng ứng dụng Ng−ời quản lý ứng dụng Hệ thống file Các kiểm soát của OS Cơ sở File thực dữ liệu Các kiểm soát hiện của phần cứng Hình 8. Kiến trúc của một DBMS có các đặc tính an toàn 27
  29. Mô đun an toàn của DBMS quản lý tất cả các câu hỏi. Nó gồm có các quy tắc trao quyền (cho kiểm soát tuỳ ý) và các tiên đề an toàn (cho các kiểm soát bắt buộc). AS sử dụng một, hoặc cả hai, tuỳ thuộc vào các chính sách bảo vệ của hệ thống. Trong cùng một môđun có thể có nhiều l−ợc đồ DB, vì chúng cũng là các đối t−ợng cần đ−ợc bảo vệ. Quản lý hệ thống an toàn có các vai trò sau: • Ng−ời quản lý ứng dụng: có trách nhiệm đối với việc phát triển và duy trì, hoặc các ch−ơng trình th− viện; • DBA: quản lý các l−ợc đồ khái niệm và l−ợc đồ bên trong của cơ sở dữ liệu; • Nhân viên an toàn: xác định các quyền truy nhập, và/hoặc các tiên đề, thông qua các quy tắc trong một ngôn ngữ thích hợp (có thể là DLL, hoặc DML); • Kiểm toán viên: chịu trách nhiệm kiểm tra các yêu cầu kết nối và các câu hỏi truy nhập, nhằm phát hiện ra các xâm phạm quyền. 5. Thiết kế cơ sở dữ liệu an toàn Nh− chúng ta đã biết, an toàn cơ sở dữ liệu bao gồm: (1) Mức ngoài: kiểm soát truy nhập vật lý vào hệ thống xử lý, bảo vệ hệ thống xử lý khỏi các thảm hoạ tự nhiên, do con ng−ời hoặc máy móc gây ra. (2) Mức trong: chống lại các tấn công có thể xảy ra đối với hệ thống, xuất phát từ sự không trung thực, gây lỗi hoặc thiếu tinh thần trách nhiệm của những ng−ời trong hoặc bên ngoài hệ thống. Các mức này đ−ợc xem là an toàn vật lý và an toàn lôgíc. Vài năm tr−ớc đây, an toàn vật lý đ−ợc chú ý nhiều hơn cả, vì xét theo góc độ bảo vệ chung, nó là một "quá trình khoá" tài nguyên hệ thống trong môi tr−ờng vật lý an toàn. Không thể đảm bảo an toàn chắc chắn nếu chỉ dựa vào bảo vệ vật lý. Trong thực tế, ng−ời dùng hợp pháp có thể truy nhập gian lận dữ liệu. Đây là một hình thức lạm dụng quyền. Do vậy, quyền truy nhập thông tin "nhậy cảm" chỉ nên trao cho những ng−ời dùng đ−ợc chọn lựa, tùy thuộc vào chế độ truy nhập đã chọn và tập giới hạn các mục dữ liệu. 28
  30. Nói chung, các yêu cầu bảo vệ của một hệ thống gắn liền với môi tr−ờng (nơi hệ thống đ−ợc sử dụng) và tình trạng kinh tế. Các đặc tính an toàn làm tăng chi phí và giảm hiệu năng. Chúng còn làm tăng độ phức tạp của hệ thống, làm giảm tính mềm dẻo, đòi hỏi nguồn nhân lực cho việc thiết kế, quản lý và duy trì, tăng yêu cầu đối với phần mềm và phần cứng. Tuy nhiên, hiện nay chúng ta còn thiếu các biện pháp an toàn thông qua phát hiện các rủi ro có chi phí khắc phục hệ thống hỏng rất lớn. Cần đánh giá chính xác các sự rủi ro, dựa trên loại hình môi tr−ờng và ng−ời dùng. Ví dụ, các yêu cầu an toàn của các hệ thống thông tin th−ơng mại/ cá nhân và hệ thống thông tin của chính phủ có sự khác nhau. 5.1 Cơ sở dữ liệu trong các cơ quan chính phủ Tại một số n−ớc, sau khi phân tích các vấn đề về an toàn cơ sở dữ liệu, ng−ời ta đã tiến hành phân loại một số cơ sở dữ liệu, tuỳ thuộc vào nội dung của chúng: thông tin thiết yếu là thông tin cần thiết cho an ninh quốc gia và thông tin không thiết yếu là thông tin đ−ợc biết, dựa vào các kiểm soát hoặc quyền thích hợp. Cơ sở dữ liệu có các kiểu thông tin này đ−ợc gọi là các cơ sở dữ liệu đ−ợc phân loại. Trong đó, dữ liệu đ−ợc phân thành các mức an toàn khác nhau (chẳng hạn nh− mật, tuyệt mật), tuỳ theo mức nhậy cảm của nó. Truy nhập đ−ợc trao chính xác cho ng−ời dùng và giao dịch, tuỳ theo mức an toàn định tr−ớc. Trong những môi tr−ờng này, việc phát hiện các nỗ lực thâm nhập rất khó khăn. Động cơ thâm nhập vào cơ sở dữ liệu của các cá nhân cao hơn, họ có thể sử dụng các công cụ tinh vi không để lại dấu vết. Tính toàn vẹn thông tin và từ chối dịch vụ (ngăn chặn ng−ời dùng hợp pháp sử dụng tài nguyên hệ thống) là các vấn đề trong kiểu cơ sở dữ liệu này. 5.2 Các cơ sở dữ liệu th−ơng mại Tr−ớc hết, việc đánh giá thiệt hại trong các hệ thống thông tin của các tổ chức th−ơng mại khá dễ dàng. Mức độ nhậy cảm của dữ liệu do tổ chức công bố, bằng cách phân biệt giữa dữ liệu thiết yếu và dữ liệu có yêu cầu bảo vệ thấp hơn. Do vậy, thiết kế an toàn trong các cơ sở dữ liệu th−ơng mại rất ít khi đ−ợc xem là mối quan tâm hàng đầu, các vấn đề an toàn cũng không đ−ợc chú ý nhiều. Trong các môi tr−ờng này, các vấn đề an toàn xuất phát từ ng−ời dùng hợp pháp; Thực tế, việc kiểm tra sơ bộ độ tin cậy của ng−ời dùng còn lỏng lẻo. Các thủ tục 29
  31. trao quyền ch−a thích hợp, các kỹ thuật kiểm soát và công cụ kiểm tra truy nhập (vào dữ liệu và ch−ơng trình) mà ng−ời dùng đ−ợc phép, còn khá nghèo nàn. Hơn nữa, độ phức tạp của các vấn đề an toàn phụ thuộc vào ngữ nghĩa của cơ sở dữ liệu. Độ an toàn do công nghệ DBMS cung cấp hiện nay khá thấp. Thực tế, cơ sở dữ liệu là điểm yếu dễ bị tấn công bởi các tấn công đơn giản, chứ ch−a nói đến các kỹ thuật phức tạp nh− con ngựa thành tơ roa, tấn công suy diễn, sâu, các trình tìm vết và cửa sập. Các kiến trúc DBMS an toàn đa mức đã đ−ợc đề xuất, nhằm đáp ứng các yêu cầu bảo vệ đa mức. Một số kiến trúc đa mức đ−ợc đề xuất là Integrity Lock, Kernelized, Replicated. Chúng ta sẽ xem xét chi tiết các kiến trúc này trong các ch−ơng sau. Tóm lại Kiểm soát truy nhập trong một hệ thống tuân theo các chính sách truy nhập (chỉ ra ai là ng−ời có thể truy nhập và truy nhập vào những đối t−ợng nào của hệ thống). Chính sách truy nhập không nên phụ thuộc vào các cơ chế thực thi kiểm soát truy nhập vật lý. Chính sách truy nhập xác định các yêu cầu truy nhập. Sau đó, các yêu cầu đ−ợc chuyển thành các quy tắc truy nhập, dựa vào các chính sách đ−ợc phê chuẩn. Đây là giai đoạn thiết yếu khi phát triển hệ thống an toàn. Tính đúng đắn và đầy đủ của các quy tắc và cơ chế thực thi t−ơng ứng đ−ợc xác định trong giai đoạn này. Quá trình ánh xạ cần đ−ợc thực hiện, bằng cách sử dụng các kỹ thuật xây dựng mô hình cho các yêu cầu và chính sách an toàn: một mô hình cho phép nhà thiết kế miêu tả rõ ràng và kiểm tra các đặc tính an toàn của hệ thống. Có rất nhiều hiểm hoạ có thể xảy ra đối với tính bí mật và toàn vẹn của cơ sở dữ liệu, chúng làm cho việc bảo vệ cơ sở dữ liệu trở nên phức tạp hơn. Chính vì vậy, việc bảo vệ cơ sở dữ liệu đòi hỏi nhiều biện pháp, trong đó có cả con ng−ời, phần mềm và phần cứng. Bất kỳ điểm yếu nào của chúng cũng làm ảnh h−ởng đến độ an toàn của toàn bộ hệ thống. Hơn nữa, bảo vệ dữ liệu cũng nảy sinh nhiều vấn đề về tính tin cậy của hệ thống. Tóm lại, khi phát triển một hệ thống an toàn, chúng ta cần quan tâm đến một số khía cạnh thiết yếu sau: 30
  32. • Các đặc điểm của môi tr−ờng xử lý và l−u giữ thực tế. Cần phân tích cẩn thận để định ra mức bảo vệ theo yêu cầu của hệ thống: đây chính là các yêu cầu an toàn; • Các cơ chế bảo vệ bên ngoài môi tr−ờng xử lý. Chúng là các biện pháp kiểm soát vật lý và quản trị, góp phần đảm bảo hiệu lực của các cơ chế hoạt động an toàn; • Các cơ chế bảo vệ cơ sở dữ liệu bên trong. Chúng đ−ợc thực hiện sau khi ng−ời dùng qua đ−ợc các kiểm soát đăng nhập và xác thực; • Tổ chức vật lý của các thông tin đ−ợc l−u giữ; • Các đặc tính an toàn do hệ điều hành và phần cứng cung cấp; • Độ tin cậy của phần mềm và phần cứng; • Các khía cạnh về tổ chức, con ng−ời. 31
  33. Thiết kế cơ sở dữ liệu an toμn 1 Giới thiệu An toàn cơ sở dữ liệu lôgíc giải quyết các vấn đề an toàn (tính bí mật và toàn vẹn) thông qua một bộ các quy tắc nhằm thiết lập các truy nhập hợp pháp vào thông tin và tài nguyên của cơ sở dữ liệu. Các quy tắc này phải đ−ợc định nghĩa chính xác và dựa trên cơ sở (hay tuân theo) các yêu cầu và chính sách an toàn của tổ chức, tránh các mâu thuẫn và các lỗi có thể là các điểm yếu dễ bị tấn công của hệ thống. An toàn lôgíc phải đ−ợc coi là một phần bên trong của hệ thống an toàn toàn cục của tổ chức. Thiết kế lôgíc của một hệ thống an toàn có nghĩa là thiết kế phần mềm an toàn và các quy tắc an toàn. Phần mềm an toàn bao gồm các bó ch−ơng trình an toàn, chẳng hạn nh− các hệ điều hành an toàn, các DBMS an toàn và các thủ tục an toàn phi thể thức. Thiết kế phải tận dụng đ−ợc các chuẩn an toàn hiện có. Các quy tắc an toàn phải đ−ợc định nghĩa chính xác và thích ứng, đáp ứng đ−ợc các yêu cầu khác nhau của ng−ời sử dụng và đảm bảo tính bí mật và toàn vẹn của một hệ thống. Thêm vào đó, việc thiết kế các quy tắc an toàn phải phù hợp với các hoạt động thiết kế cơ sở dữ liệu. Các quy tắc an toàn đối với một cơ sở dữ liệu ngày càng phức tạp hơn, nó không chỉ đơn thuần là các danh sách kiểm soát truy nhập, hoặc các bảng biểu đơn giản. Trong thực tế, cơ sở của các quy tắc an toàn có thể đ−ợc xem nh− là một cơ sở dữ liệu. Nói chung, các giai đoạn phân tích, thiết kế khái niệm, thực hiện thiết kế chi tiết, thử nghiệm và duy trì cũng đ−ợc áp dụng khi phát triển hệ thống an toàn. Mục đầu tiên của phần này trình bày các giải pháp đ−ợc sử dụng để thiết kế DBMS an toàn; Trình bày một số mẫu nghiên cứu và các sản phẩm DBMS an toàn th−ơng mại; Tiếp theo trình bày một giải pháp mang tính ph−ơng pháp luận nhằm thiết kế các quy tắc an toàn. 32
  34. 2 Thiết kế DBMS an toàn Cơ sở dữ liệu là một tập hợp các dữ liệu đ−ợc tổ chức và quản lý thông qua phần mềm xác định, DBMS. Việc đảm bảo an toàn cơ sở dữ liệu thông qua các kỹ thuật ở cả hai mức DBMS và OS. Khi thực hiện các yêu cầu an toàn, DBMS có thể khai thác các chức năng an toàn bắt buộc ở mức OS. Nói riêng, các chức năng quản lý I/O và quản lý tài nguyên chia sẻ chứng minh tính an toàn của các môi tr−ờng DBMS. Tuy nhiên, các chức năng an toàn DBMS không nên bị coi là một mở rộng của các chức năng OS cơ sở. Các mối quan tâm khác nhau về an toàn giữa các OS và DBMS đ−ợc liệt kê sau đây: • Độ chi tiết của đối t−ợng (Object granularity): Trong OS, độ chi tiết ở mức tệp (file). Trong DBMS , nó chi tiết hơn (ví dụ nh−: các quan hệ, các hàng, các cột, các tr−ờng). • Các t−ơng quan ngữ nghĩa trong dữ liệu (Semantic correlations among data): Dữ liệu trong một cơ sở dữ liệu có ngữ nghĩa và liên quan với nhau thông qua các quan hệ ngữ nghĩa. Do vậy, nên tuân theo các kiểu kiểm soát truy nhập khác nhau, tuỳ thuộc vào các nội dung của đối t−ợng, ngữ cảnh và l−ợc sử truy nhập, để bảo đảm thực hiện chính xác các yêu cầu an toàn trong dữ liệu. • Siêu dữ liệu (Metadata): Siêu dữ liệu tồn tại trong một DBMS, cung cấp thông tin về cấu trúc của dữ liệu trong cơ sở dữ liệu. Siêu dữ liệu th−ờng đ−ợc l−u giữ trong các từ điển dữ liệu. Ví dụ, trong các cơ sở dữ liệu, siêu dữ liệu mô tả các thuộc tính, miền của các thuộc tính, quan hệ giữa các thuộc tính và vị trí phân hoạch cơ sở dữ liệu. Trong thực tế, siêu dữ liệu có thể cung cấp các thông tin nhạy cảm về nội dung của cơ sở dữ liệu (các kiểu dữ liệu và quan hệ) và có thể đ−ợc sử dụng nh− là một ph−ơng pháp nhằm kiểm soát truy nhập vào dữ liệu cơ sở. Không có các mô tả siêu dữ liệu tồn tại trong OS. • Các đối t−ợng lôgíc và vật lý (Logical and physical objects): Các đối t−ợng trong một OS là các đối t−ợng vật lý (ví dụ: các file, các thiết bị, bộ nhớ và các tiến trình). Các đối t−ợng trong một DBMS là các đối t−ợng lôgíc (ví dụ: các quan hệ, các khung nhìn). Các đối t−ợng lôgíc của DBMS không phụ thuộc vào các đối t−ợng vật lý của OS, điều này đòi hỏi các yêu cầu và các kỹ 33
  35. thuật an toàn đặc biệt, đ−ợc định h−ớng cho việc bảo vệ đối t−ợng của cơ sở dữ liệu. • Các kiểu dữ liệu bội (Multiple data types): Đặc điểm của các cơ sở dữ liệu đ−ợc xác định thông qua các kiểu dữ liệu, cho các chế độ đa truy nhập nào đ−ợc yêu cầu (ví dụ: chế độ thống kê, chế độ quản trị). Tại mức OS chỉ tồn tại truy nhập vật lý, cho ghi, đọc và thực hiện các thao tác. • Các đối t−ợng động và tĩnh (Static and dynamic objects): Các đối t−ợng đ−ợc OS quản lý là các đối t−ợng tĩnh và t−ơng ứng với các đối t−ợng thực. Trong các cơ sở dữ liệu, các đối t−ợng có thể đ−ợc tạo ra động (ví dụ, các kết quả hỏi đáp) và không có các đối t−ợng thực t−ơng ứng. Ví dụ, khung nhìn của các cơ sở dữ liệu đ−ợc tạo ra động, nh− các quan hệ ảo có nguồn gốc từ các quan hệ cơ sở đ−ợc l−u giữ thực tế trong cơ sở dữ liệu. Nên định nghĩa các yêu cầu bảo vệ xác định nhằm đối phó với các đối t−ợng động. • Các giao tác đa mức (Multilevel transactions): Trong một DBMS th−ờng có các giao tác đòi hỏi dữ liệu ở các mức an toàn khác nhau. DBMS phải bảo đảm các giao tác đa mức đ−ợc thực hiện theo một cách an toàn. Tại mức OS, chỉ có các thao tác cơ bản mới đ−ợc thực hiện (ví dụ, đọc, ghi, thực hiện), đòi hỏi dữ liệu có cùng mức an toàn. • Thời gian tồn tại của dữ liệu (Data life cycle): Dữ liệu trong một cơ sở dữ liệu có thời gian tồn tại dài và DBMS có thể đảm bảo việc bảo vệ từ đầu đến cuối thời gian tồn tại của dữ liệu. 2.1. Các cơ chế an toàn trong các DBMS An toàn dữ liệu đ−ợc quan tâm cùng với việc khám phá hoặc sửa đổi trái phép thông tin, chẳng hạn nh− chèn thêm các mục dữ liệu, xoá, thay đổi dữ liệu hiện có. Một DBMS đòi hỏi nhiều tính năng nhằm đạt đ−ợc các yêu cầu an toàn của một hệ thống thông tin. DBMS đóng một vai trò trung tâm bởi vì nó xử lý các quan hệ phức tạp trong dữ liệu. Một số chức năng an toàn chủ chốt phải đ−ợc OS cung cấp, trong khi đó các ràng buộc an toàn xác định tại mức ứng dụng lại đ−ợc DBMS xử lý, sau đó nó đ−ợc uỷ thác ngăn chặn các ứng dụng khám phá hoặc làm h− hại dữ liệu. 34
  36. Các yêu cầu an toàn chính (mà một DBMS nên cung cấp) liên quan đến các vấn đề sau đây: • Các mức độ truy nhập chi tiết khác nhau (Different degrees of granularity of access): DBMS nên bảo đảm kiểm soát truy nhập với các mức độ chi tiết khác nhau. Đối với các cơ sở dữ liệu, kiểm soát truy nhập có thể đ−ợc áp dụng theo các mức độ chi tiết nh−: cơ sở dữ liệu, các quan hệ, một quan hệ, một số cột của một quan hệ, một số hàng của một quan hệ, một số hàng và một số cột của một quan hệ. • Các chế độ truy nhập khác nhau (Different access modes): Phải phân biệt đ−ợc các kiểm soát truy nhập (ví dụ, một ng−ời làm công đ−ợc quyền đọc một mục dữ liệu nh−ng không đ−ợc phép ghi lên nó). Trong các cơ sở dữ liệu, các chế độ truy nhập đ−ợc đ−a ra d−ới dạng các lệnh SQL cơ bản (ví dụ: SELECT, INSERT, UPDATE, DELETE). • Các kiểu kiểm soát truy nhập khác nhau (Different types of access controls): Các yêu cầu truy nhập có thể đ−ợc xử lý, bằng cách sử dụng các kiểu kiểm soát khác nhau. ắ Các kiểm soát phụ thuộc tên (Name-dependent controls) dựa vào tên của đối t−ợng bị truy nhập. ắ Các kiểm soát phụ thuộc dữ liệu (Data-dependent controls) thực hiện truy nhập phụ thuộc vào các nội dung của đối t−ợng bị truy nhập. ắ Các kiểm soát phụ thuộc ngữ cảnh (Context-dependent controls) chấp thuận hoặc từ chối truy nhập phụ thuộc vào giá trị của một số biến hệ thống (ví dụ nh−: ngày, tháng, thiết bị đầu cuối yêu cầu). ắ Các kiểm soát phụ thuộc l−ợc sử (History-dependent controls) quan tâm đến các thông tin về trình tự câu truy vấn (ví dụ nh−: các kiểu câu truy vấn, dữ liệu trả lại, profile của ng−ời dùng). ắ Các kiểm soát phụ thuộc kết quả (Result-dependent controls) thực hiện quyết định truy nhập phụ thuộc vào kết quả của các thủ tục kiểm soát hỗ trợ, chúng là các thủ tục đ−ợc thực hiện tại thời điểm hỏi. 35
  37. Trong các cơ sở dữ liệu, kiểm soát truy nhập phụ thuộc dữ liệu th−ờng đ−ợc thực hiện thông qua các cơ chế sửa đổi câu truy vấn hoặc cơ chế sửa đổi dựa vào khung nhìn. Các khung nhìn là các quan hệ ảo xuất phát từ các quan hệ cơ sở (là các quan hệ đ−ợc l−u giữ thực trong cơ sở dữ liệu) và các khung nhìn khác, tuỳ thuộc vào tiêu chuẩn chọn lựa các bộ (tuple) hoặc các thuộc tính. Khi sử dụng một kỹ thuật sửa đổi câu truy vấn , câu truy vấn ban đầu (do ng−ời sử dụng yêu cầu) bị hạn chế đến mức nào còn tuỳ thuộc vào các quyền của ng−ời sử dụng. • Quyền động (Dynamic authorization): DBMS nên hỗ trợ việc sửa đổi các quyền của ng−ời sử dụng trong khi cơ sở dữ liệu đang hoạt động. Điều này t−ơng ứng với nguyên tắc đặc quyền tối thiểu, có thể sửa đổi các quyền tuỳ thuộc vào các nhiệm vụ của ng−ời sử dụng. • Bảo vệ đa mức (Multilevel protection): Khi đ−ợc yêu cầu, DBMS nên tuân theo bảo vệ đa mức, thông qua chính sách bắt buộc. Các kiểm soát truy nhập bắt buộc (Mandatory access controls) dựa vào các nhãn an toàn đ−ợc gán cho các đối t−ợng (là các mục dữ liệu) và các chủ thể (là những ng−ời sử dụng). Trong các môi tr−ờng quân sự, các nhãn an toàn bao gồm: một thành phần phân cấp (hierarchical component) và một tập rỗng các loại không phân cấp (có thể có). DBMS nên cung cấp các kỹ thuật để định nghĩa các nhãn an toàn và gán nhãn cho các đối t−ợng và các chủ thể. Bằng cách sử dụng các nhãn an toàn, DBMS nên tuân theo bảo vệ đa mức, trong đó các nhãn an toàn khác nhau đ−ợc gán cho các mục dữ liệu khác nhau trong cùng một đối t−ợng. Ví dụ, trong các cơ sở dữ liệu quan hệ, mỗi quan hệ nên có một nhãn an toàn cho tr−ớc, nhãn an toàn này chứa các thuộc tính với các nhãn an toàn của chúng (có thể khác với nhãn quan hệ) và lần l−ợt l−u giữ các giá trị với các nhãn an toàn của chúng. • Các kênh ngầm (Covert channels): DBMS không nên để ng−ời sử dụng thu đ−ợc các thông tin trái phép thông qua các ph−ơng pháp truyền thông gián tiếp. • Các kiểm soát suy diễn (Inference controls): Các kiểm soát suy diễn nên ngăn chặn ng−ời sử dụng suy diễn dựa vào các thông tin mà họ thu đ−ợc trong cơ sở dữ liệu. Trong một hệ thống cơ sở dữ liệu, các vấn đề suy diễn th−ờng liên quan đến các vấn đề về gộp (aggregation) và quan hệ dữ liệu 36
  38. (data association). DBMS nên cung cấp một cách thức để gán phân loại cho các thông tin đ−ợc gộp, phản ánh mức nhạy cảm của các mục dữ liệu đ−ợc gộp. Khi đó, các thông tin (nh− quan hệ của các mục dữ liệu, hoặc tập hợp các mục dữ liệu) nhạy cảm hơn so với các mục dữ liệu đơn lẻ, nên chúng phải đ−ợc quản lý phù hợp. DBMS không nên để ng−ời sử dụng (thông qua các kiểm soát suy diễn) biết các thông tin tích luỹ đ−ợc phân loại ở mức cao, bằng cách sử dụng các mục dữ liệu đ−ợc phân loại ở mức thấp. Trong một cơ sở dữ liệu quan hệ, các kỹ thuật hạn chế câu truy vấn th−ờng đ−ợc sử dụng để tránh suy diễn. Các kỹ thuật nh− vậy có thể sửa đổi câu truy vấn ban đầu, hoặc huỷ bỏ câu truy vấn. Các kỹ thuật đa thể hiện (polyinstantiation) và kiểm toán cũng có thể đ−ợc sử dụng cho mục đích này. Cuối cùng, một kiểu suy diễn đặc biệt xảy ra trong các cơ sở dữ liệu thống kê, nơi mà ng−ời sử dụng không đ−ợc phép suy diễn các mục dữ liệu cá nhân từ dữ liệu kiểm toán đã đ−ợc gộp, ng−ời sử dụng có thể thu đ−ợc các dữ liệu này từ các câu truy vấn kiểm toán. • Đa thể hiện (polyinstantiation): Kỹ thuật này có thể đ−ợc DBMS sử dụng để ngăn chặn suy diễn, bằng cách cho phép cơ sở dữ liệu có nhiều thể hiện cho cùng một mục dữ liệu, mỗi thể hiện có một mức phân loại riêng. Trong một cơ sở dữ liệu quan hệ có thể có các bộ khác nhau với cùng một khoá, với mức phân loại khác nhau, ví dụ nếu tồn tại một hàng (đ−ợc phân loại ở mức cao) và một ng−ời sử dụng (đ−ợc phân loại ở mức thấp) yêu cầu chèn thêm một hàng mới có cùng khoá. Điều này ngăn chặn ng−ời sử dụng (đ−ợc phân loại ở mức thấp) suy diễn sự tồn tại của hàng (đ−ợc phân loại ở mức cao) trong cơ sở dữ liệu. • Kiểm toán (Auditing): Các sự kiện liên quan tới an toàn (xảy ra trong khi hệ thống cơ sở dữ liệu đang hoạt động) nên đ−ợc ghi lại và theo một khuôn dạng có cấu trúc, chẳng hạn nh−: nhật ký hệ thống, vết kiểm toán. Các vết kiểm toán rất hữu ích cho các phân tích về sau để phát hiện ra các mối đe doạ có thể xảy ra cho cơ sở dữ liệu. Thông tin kiểm toán cũng hữu ích cho kiểm soát suy diễn, nhờ đó chúng ta có thể kiểm tra đ−ợc l−ợc sử của các câu truy vấn do ng−ời sử dụng đ−a ra, để quyết định xem có nên trả lời câu truy vấn mới hay không, vì câu truy vấn mới này lại liên quan đến các đáp ứng của các câu truy vấn tr−ớc đó, có thể dẫn đến một vi phạm suy diễn. 37
  39. • Các kiểm soát luồng (Flow controls): Các kiểm soát luồng kiểm tra đích của đầu ra. Chúng ta có thể có đ−ợc kiểm soát này thông qua một truy nhập đ−ợc phép (authorized access). • Không cửa sau (No back door): Truy nhập vào dữ liệu chỉ nên xảy ra thông qua DBMS. Phải đảm bảo không có các đ−ờng dẫn truy nhập ẩn. • Tính chất không thay đổi của các cơ chế (Uniformity of mechanisms): Nên sử dụng các cơ chế chung để hỗ trợ các chính sách khác nhau và tất cả các kiểm soát liên quan tới an toàn (các kiểm soát bí mật và toàn vẹn). • Hiệu năng hợp lý (Reasonable performance): Các kiểm soát an toàn làm tăng thời gian hoạt động; Cần tối thiểu hoá để đảm bảo hiệu năng của hệ thống. Hơn nữa, ở đây có rất nhiều nguyên tắc cơ bản cho toàn vẹn thông tin, chúng độc lập với ngữ cảnh của DBMS và các đặc thù của ứng dụng. Lợi ích của các nguyên tắc này là giúp chúng ta đánh giá các chính sách an toàn của một hệ thống thông tin xác định. • Các giao tác đúng đắn (Well-formed transactions): Nguyên tắc này (còn đ−ợc gọi là sự thay đổi có ràng buộc) xác định: chỉ đ−ợc sửa dữ liệu thông qua các giao tác đúng đắn. Độ chính xác của các giao tác này đ−ợc chứng thực với một mức độ đảm bảo nào đó. Các giao tác này chuyển sang các cơ chế DBMS để đảm bảo các thuộc tính cho giao tác. DBMS phải đảm bảo rằng các cập nhật phải đ−ợc thực hiện thông qua các giao tác, l−u ý rằng cơ sở dữ liệu phải đ−ợc đóng gói trong DBMS thông qua OS. • Ng−ời sử dụng đ−ợc xác thực (Authenticated users): Theo nguyên tắc này, không nên cho ng−ời sử dụng thực hiện các thay đổi trừ khi nhận dạng của họ đ−ợc xác thực chính xác. Việc xác thực ng−ời sử dụng thuộc trách nhiệm của OS và không cần phải lặp lại trong DBMS. Việc xác thực làm cơ sở cho một số nguyên tắc khác đ−ợc liệt kê sau đây (đặc quyền tối thiểu, tách bạch nhiệm vụ, uỷ quyền). • Đặc quyền tối thiểu (Least privilege): Đây là một nguyên tắc giới hạn ng−ời sử dụng chỉ đ−ợc làm việc với một tập tối thiểu các đặc quyền và tài nguyên 38
  40. cần thiết để thực hiện nhiệm vụ của mình. Đặc quyền tối thiểu chuyển sang các cơ chế DBMS cho các thao tác "đọc" và "ghi". • Tách bạch nhiệm vụ (Separation of duties): Nguyên tắc này đ−ợc đ−a ra nhằm hạn chế tối đa một cá nhân bất kỳ có thể phá hoại dữ liệu, để đảm bảo toàn vẹn dữ liệu. Tách bạch nhiệm vụ đ−ợc gắn liền với các kiểm soát trên các chuỗi giao tác. Hiện tại có nhiều cơ chế nh−ng chúng không đ−ợc thiết kế cho các mục đích toàn vẹn, do vậy gây ra một số bất tiện. • Tính liên tục của hoạt động (Continuity of operation): Vấn đề này đã nhận đ−ợc nhiều sự quan tâm, cả về mặt lý thuyết và thực tế, các giải pháp dựa trên cơ sở lặp dữ liệu cũng đã đ−ợc đề xuất. Đối mặt với các sự cố phá hoại v−ợt ngoài tầm kiểm soát của tổ chức, nên duy trì các hoạt động của hệ thống sau khi sự cố xảy ra (quan tâm đến các biện pháp an toàn vật lý). • Dựng lại các sự kiện (Reconstruction of events): Việc dựng lại các sự kiện trong một DBMS phụ thuộc vào các vết kiểm toán. Việc dựng lại có thể xảy ra ở nhiều mức vết khác nhau, nhiều việc khác nhau nh−: ghi lại một l−ợc sử đầy đủ về việc sửa đổi giá trị của một mục dữ liệu, hoặc l−u giữ nhận dạng của từng cá nhân khi thực hiện từng thay đổi. Một vấn đề đặt ra là chất l−ợng của dữ liệu trong vết kiểm toán cũng phải phù hợp. Một số đề xuất gần đây có sử dụng các kỹ thuật của hệ chuyên gia để l−u giữ và làm sáng tỏ các vết kiểm toán. • Kiểm tra thực tế (Reality checks): Việc kiểm tra định kỳ đối với các thực thể thực tế góp phần duy trì các giá trị dữ liệu chính xác trong hệ thống. DBMS có trách nhiệm duy trì một khung nhìn thích hợp bên trong cơ sở dữ liệu, làm cơ sở cho các kiểm tra bên ngoài. • Dễ dàng sử dụng an toàn (Ease of safe use): Cách dễ nhất để điều hành một hệ thống cũng phải là cách an toàn nhất. Điều này có nghĩa là các thủ tục an toàn nên đơn giản, phổ biến, dễ sử dụng. • Uỷ quyền (Delegation of authority): Nó quan tâm đến việc gán các đặc quyền cho tổ chức, lấy các chính sách làm cơ sở, yêu cầu các thủ tục gán phải phản ánh các quy tắc của tổ chức và chúng phải mềm dẻo. Việc uỷ quyền phải khá mềm dẻo để phù hợp với các chính sách; Nói rộng hơn, các giải pháp tổ chức 39
  41. đặc thù chuyển sang các cơ chế bắt buộc và các cơ chế tuỳ ý. Trong các cơ chế tuỳ ý, việc uỷ quyền tuỳ thuộc vào bản thân chủ thể, có thể trao hoặc thu hồi, huỷ bỏ các quyền cho ng−ời sử dụng khác. Việc uỷ quyền tuân theo các chính sách tuỳ ý, hỗ trợ cấp/huỷ bỏ các quyền. Các đặc quyền đặc biệt nên tồn tại trong DBMS, trao các quyền đặc biệt này cho một số l−ợng hạn chế ng−ời sử dụng (có nghĩa là các đặc quyền quản trị cơ sở dữ liệu). Việc trao các quyền cho những ng−ời sử dụng khác có thể gây ra một số vấn đề, khi các quyền này bị huỷ bỏ, thu hồi. DBMS nên cung cấp các cơ chế cho việc quản lý thu hồi. Uỷ quyền là một khả năng cần thiết, nhằm phản ánh cấu trúc phân cấp của tổ chức và nên thực hiện tuân theo các quy tắc (đã đ−ợc định nghĩa trong tổ chức). Uỷ quyền trong một DBMS th−ờng tuân theo các lệnh SQL GRANT/REVOKE. Nói riêng, khi quan tâm đến tính toàn vẹn của một DBMS, các nguyên tắc đ−ợc phân nhóm nh− sau: • Nhóm 1: Các giao tác đúng đắn, tính liên tục của hoạt động. Các nguyên tắc này bao trùm hoàn toàn lên các cơ chế của DBMS. • Nhóm 2: Đặc quyền tối thiểu, tách bạch nhiệm vụ, xây dựng lại các biến cố và uỷ quyền. Nhiều cơ chế mới đ−ợc yêu cầu cho nhóm này và một số giải pháp đầy triển vọng nhằm mở rộng các cơ chế của DBMS cũng đ−ợc đ−a ra. • Nhóm 3: Ng−ời sử dụng đ−ợc xác thực, kiểm tra thực tế và dễ dàng sử dụng an toàn. Xác thực là trách nhiệm của OS, kiểm tra thực tế tuỳ thuộc vào an toàn tổ chức. 2. 2 Mô mình cấp quyền System R ♣ Mô hình này quan tâm đến các bảng của cơ sở dữ liệu. Chúng có thể là các bảng cơ sở hoặc các bảng của khung nhìn. Chủ thể của mô hình này là ng−ời sử dụng, đây là những ng−ời có thể truy nhập vào cơ sở dữ liệu. Các đặc quyền mà mô hình này quan tâm là các chế độ truy nhập có thể đ−ợc áp dụng cho các bảng của cơ sở dữ liệu. Nói riêng, nó quan tâm đến các chế độ truy nhập sau: Read Để đọc các bộ (các hàng) từ một bảng Insert Thêm các bộ vào một bảng 40
  42. Delete Xoá các bộ từ một bảng Update Sửa đổi nội dung các bộ hiện có trong một bảng Drop Xoá toàn bộ một bảng ra khỏi hệ thống Mô hình đã hỗ trợ quản trị quyền phi tập trung (Decentralized administration of authorizations). Nói riêng, ng−ời sử dụng của một cơ sở dữ liệu bất kỳ có thể đ−ợc phép tạo ra một bảng mới. Khi ng−ời sử dụng tạo ra một bảng mới, chỉ có anh ta mới đ−ợc phép thực hiện các đặc quyền trên bảng (điều này không hoàn toàn đúng nếu bảng là một khung nhìn, chúng ta sẽ xem xét sau). Nh− ng−ời chủ sở hữu, ng−ời sử dụng có thể trao các đặc quyền trên bảng cho những ng−ời sử dụng khác. Khi đó, một quyền mới sẽ đ−ợc chèn thêm vào tập hợp các quyền đ−ợc quản lý trong hệ thống. Việc trao các đặc quyền cho ng−ời sử dụng khác có thể tuỳ chọn. Mỗi quyền có thể đ−ợc mô tả nh− là một bộ {s, p, t, ts,g, go}, trong đó: s là chủ thể (ng−ời sử dụng) đ−ợc trao quyền; p là đặc quyền (chế độ truy nhập); t là bảng, quyền đ−ợc áp dụng trên đó; ts là thời điểm quyền đ−ợc trao; g là ng−ời đã trao quyền; go ∈ {yes, no} chỉ báo khi nào s có tuỳ chọn trao p trên t Nếu đặc quyền là "update" thì các cột (mà trên đó đặc quyền đ−ợc thực hiện) phải đ−ợc chỉ báo. Tuỳ chọn trao (Grant option) t−ơng tự nh− là cờ copy của mô hình ma trận truy nhập. Nếu một ng−ời sử dụng nắm giữ một đặc quyền trên bảng với tuỳ chọn trao, ng−ời sử dụng này cũng có thể trao đặc quyền trên bảng cùng với tuỳ chọn trao cho những ng−ời sử dụng khác. Trên mỗi quyền, ng−ời trao quyền (g) và thời điểm trao quyền (ts) cần đ−ợc chỉ báo (đ−ợc sử dụng cho thủ tục thu hồi). 41
  43. Việc định nghĩa, thao tác dữ liệu và kiểm soát ngôn ngữ của System R, đ−ợc đặt tên là SQL, trong đó có các lệnh cho phép ng−ời sử dụng yêu cầu thực hiện các thao tác trao và thu hồi. Lệnh trao của SQL có dạng nh− sau: GRANT {ALL RIGHT (privileges) ALL BUT (privileges)} ON (table) TO (user-list) [WITH GRANT OPTION] Ng−ời sử dụng (ng−ời trao đặc quyền trên một bảng) cũng có thể ghi rõ từ khoá PUBLIC, thay cho (user-list). Khi đó, tất cả những ng−ời sử dụng của cơ sở dữ liệu đều đ−ợc trao đặc quyền trên bảng. Những ng−ời sử dụng (ng−ời có đặc quyền trên một bảng với tuỳ chọn trao) cũng có thể thu hồi đặc quyền trên bảng. Tuy nhiên, anh ta chỉ có thể thu hồi các quyền mà anh ta đã trao. Lệnh thu hồi của SQL có dạng nh− sau: REVOKE {ALL RIGHTS (privileges)} ON (table) FROM (user-list) ♣ Đối với việc thu hồi quyền, mô hình quyền System R sử dụng cơ chế thu hồi đệ quy. Chúng ta có thể diễn giải nh− sau: ng−ời sử dụng x thu hồi đặc quyền p trên bảng t từ ng−ời sử dụng y. ♣ Các khung nhìn Mô hình System R cho phép ng−ời sử dụng định nghĩa các khung nhìn ở trên các bảng cơ sở và các khung nhìn khác. Các khung nhìn (đ−ợc định nghĩa trong các giới hạn của các câu truy vấn có trên một hoặc nhiều bảng cơ sở hoặc các khung nhìn) t−ơng ứng với một cơ chế đơn lẻ và có hiệu lực để hỗ trợ cho các quyền phụ thuộc nội dung. Ng−ời sử dụng (ng−ời định nghĩa một khung nhìn) là chủ sở hữu của khung nhìn. Tuy nhiên, ch−a chắc anh ta đã đ−ợc phép thực hiện tất cả các đặc quyền trên khung nhìn. Các quyền mà ng−ời sở hữu khung nhìn có đ−ợc trên khung nhìn phụ thuộc vào ngữ nghĩa của khung nhìn (có thể có một số thao tác nào đó không có khả năng đ−ợc thực hiện trên khung nhìn) và phụ thuộc vào các quyền mà ng−ời sử dụng có đ−ợc trên các bảng có khung nhìn tham chiếu trực tiếp vào các bảng này. Nếu khung nhìn đ−ợc định nghĩa trên một bảng đơn lẻ, ng−ời sử dụng có thể đ−ợc phép thực hiện tất cả các đặc quyền trên bảng. Nếu khung nhìn đ−ợc định nghĩa trên một tập hợp các bảng, ng−ời sử dụng đ−ợc phép thực hiện tất cả các đặc quyền 42
  44. mà anh ta có trên mọi bảng đ−ợc khung nhìn tham chiếu trực tiếp. Tuy nhiên, các đặc quyền trên khung nhìn có thể bị hạn chế hơn, phụ thuộc vào ngữ nghĩa của khung nhìn. Các đặc quyền trên khung nhìn của ng−ời sở hữu đ−ợc xác định tại thời điểm định nghĩa khung nhìn. Với mọi đặc quyền mà ng−ời sử dụng có đ−ợc trên tất cả các bảng mà khung nhìn tham chiếu trực tiếp, các quyền t−ơng ứng trên khung nhìn đ−ợc định nghĩa. Nếu ng−ời sử dụng (ng−ời định nghĩa khung nhìn) đ−ợc phép thực hiện một đặc quyền trên tất cả các bảng cơ sở với tuỳ chọn trao, ng−ời sử dụng sẽ đ−ợc cho tr−ớc tuỳ chọn trao dành cho đặc quyền trên khung nhìn. Nhãn thời gian chỉ báo thời điểm định nghĩa khung nhìn. Nếu ng−ời sử dụng nhận đ−ợc một đặc quyền trên một khung nhìn với tuỳ chọn trao, anh ta có thể trao đặc quyền cho những ng−ời sử dụng khác, có thể có tuỳ chọn trao. Sau khi có một khung nhìn đã đ−ợc định nghĩa, nếu ng−ời sở hữu khung nhìn nhận thêm các đặc quyền trên các bảng cơ sở, các đặc quyền này sẽ không đ−ợc áp dụng trên khung nhìn; có nghĩa là ng−ời sử dụng sẽ không đ−ợc phép sử dụng chúng trên khung nhìn. Ng−ợc lại, nếu sau khi định nghĩa một khung nhìn, ng−ời sở hữu khung nhìn bị huỷ bỏ một đặc quyền trên bất kỳ bảng cơ sở nào, cũng cần huỷ bỏ đặc quyền trên khung nhìn. ♣ Việc thực hiện mô hình Các thông tin về quyền truy nhập cơ sở dữ liệu của ng−ời sử dụng đ−ợc l−u giữ trong 2 quan hệ, chúng có tên là SYSAUTH và SYCOLAUTH. Quan hệ SYSAUTH có các thuộc tính sau: Userid Chỉ ra ng−ời sử dụng Tname Chỉ ra bảng có quyền tham chiếu vào Type Chỉ ra kiểu của bảng Tname. Thuộc tính có giá trị "R" nếu bảng là một bảng cơ sở và "V" nếu bảng là một bảng của khung nhìn Grantor Chỉ ra ng−ời trao các quyền 43
  45. Read Chỉ ra thời điểm Grantor trao đặc quyền đọc trên bảng cho Grantee. Nếu grantor không trao đặc quyền này cho grantee, thuộc tính có giá trị 0 Insert Chỉ ra thời điểm grantor trao đặc quyền chèn thêm trên bảng cho grantee. Nếu grantor không trao đặc quyền này cho grantee, thuộc tính có giá trị 0 Delete Chỉ ra thời điểm grantor trao đặc quyền cập nhật trên bảng cho grantee. Nếu grantor không trao đặc quyền này cho grantee, thuộc tính có giá trị 0 Update Chỉ ra các cột có đặc quyền cập nhật đ−ợc trao. Nếu có giá trị "All", có nghĩa là có thể cập nhật trên tất cả các cột. Nếu có giá trị "None", có nghĩa là không có đặc quyền cập nhật trên bảng, hoặc "Some", có nghĩa là đặc quyền chỉ đ−ợc thực hiện trên một số cột nào đó của bảng Grantopt Chỉ ra khi có các đặc quyền đ−ợc trao với tùy chọn trao Quan hệ SYCOLAUTH có các thuộc tính sau đây: Userid Chỉ ra ng−ời sử dụng đ−ợc trao đặc quyền cập nhật Table Chỉ ra bảng trên đó đặc quyền cập nhật đ−ợc trao Column Chỉ ra cột của Table trên đó đặc quyền cập nhật đ−ợc trao Grantor Chỉ ra ng−ời sử dụng đã trao đặc quyền Grantopt Chỉ ra khi có đặc quyền đ−ợc trao với tuỳ chọn trao ♣ Các mở rộng cho mô hình 44
  46. Mô hình quyền của System R đã đ−ợc Wilms và Linsday mở rộng năm 1982 với nhiều chức năng phục vụ cho quản lý nhóm. Ng−ời sử dụng có thể đ−ợc phân thành các nhóm. Các nhóm có thể gắn kết với nhau, một nhóm có thể xuất hiện nh− là một thành viên của nhóm khác. Sau đó, các quyền truy nhập có thể đ−ợc trao cho một nhóm, có nghĩa là các quyền này đ−ợc trao cho tất cả các thành viên của nhóm. Hai mở rộng chính cho mô hình đ−ợc đ−a ra nh− sau. Mở rộng thứ nhất giới thiệu một kiểu thao tác thu hồi, trong đề xuất ban đầu, bất cứ khi nào xảy ra việc thu hồi một quyền từ một ng−ời sử dụng, có thể phải thực hiện quá trình thu hồi đệ quy. Một vấn đề xảy ra đối với giải pháp này là nó rất dễ bị phá vỡ. Thật vậy, trong nhiều tổ chức, các quyền (mà một ng−ời sử dụng sở hữu) liên quan đến nhiệm vụ hoặc chức năng đặc thù của anh ta trong tổ chức. Nếu ng−ời sử dụng thay đổi nhiệm vụ hoặc chức năng của anh ta, ví dụ, anh ta đ−ợc thăng chức; Làm sao có thể loại bỏ các quyền dành ng−ời sử dụng này mà không cần phải thu hồi đệ quy tất cả các quyền mà ng−ời sử dụng này đã trao. Vì vậy, có một kiểu thao tác thu hồi không cần thực hiện quá trình thu hồi đệ quy các quyền. Mở rộng thứ hai quan tâm đến quyền phủ định. Hầu hết các DBMS sử dụng chính sách thế giới khép kín. Theo chính sách này, việc thiếu vắng một quyền đ−ợc hiểu nh− là một quyền phủ định. Do vậy, bất kỳ khi nào ng−ời sử dụng cố gắng truy nhập vào một đối t−ợng, nếu không tìm thấy quyền hợp lệ trong các catalog của hệ thống, ng−ời sử dụng không đ−ợc phép truy nhập. Giải pháp này có một vấn đề chính, đó là sự thiếu vắng một quyền xác định (dành cho một ng−ời sử dụng xác định) không ngăn chặn đ−ợc việc anh ta nhận đ−ợc quyền này ngay sau đó. Quyền phủ định th−ờng mạnh hơn quyền khẳng định (các quyền đ−ợc phép truy nhập). Vì vậy, bất kỳ khi nào ng−ời sử dụng có cả 2 quyền (khẳng định và phủ định) trên cùng một đối t−ợng, ng−ời sử dụng không đ−ợc phép truy nhập vào đối t−ợng, ngay cả khi quyền khẳng định đ−ợc trao ngay sau khi quyền phủ định đ−ợc trao, ng−ời sử dụng vẫn không đ−ợc phép truy nhập. 2.3 Các kiến trúc của DBMS an toàn Trong phần này trình bày một số đặc điểm chính của của các kiến trúc DBMS an toàn. Các DBMS an toàn hoạt động theo 2 chế độ: mức an toàn hệ thống cao và đa mức. 45
  47. Trong các DBMS mức an toàn hệ thống cao, tất cả những ng−ời sử dụng đ−ợc chuyển sang mức an toàn cao nhất, tr−ớc khi loại bỏ dữ liệu và có một ng−ời có trách nhiệm xem xét dữ liệu này để loại bỏ chúng một cách chính xác. Giải pháp này cho phép ng−ời sử dụng sử dụng các kỹ thuật DBMS hiện có, nh−ng phát sinh một số chi phí cho các "thủ tục cho phép" và xem xét dữ liệu thủ công. Chế độ này có thể làm tăng thêm một số rủi ro an toàn khi tất cả những ng−ời sử dụng đ−ợc chuyển sang mức cho phép cao nhất. Với chế độ đa mức, có thể có nhiều kiểu kiến trúc khác nhau, dựa vào việc sử dụng các DBMS tin cậy và không tin cậy. Các kiến trúc đa mức nh−: kiến trúc Trusted Subject (chủ thể tin cậy) và các kiến trúc Woods Hole, chúng đ−ợc Woods Hole Summer Study đề xuất năm 1982. Các kiến trúc Woods Hole bao gồm: Integrity Lock, Kernelized và các kiến trúc Replicated. Trong các kiến trúc Trusted Subject, sử dụng cả DBMS tin cậy và DBMS không tin cậy, trong khi đó các kiến trúc Woods Hole chỉ sử dụng DBMS không tin cậy cùng với một bộ lọc tin cậy. Bảng 1 đ−a ra một cái nhìn tổng quan về các kiến trúc đ−ợc sử dụng trong một số DBMS th−ơng mại và trong một số mẫu thử nghiên cứu của DBMS. Bảng 1 Các kiến trúc mẫu thử DBMS và các sản phẩm th−ơng mại Kiến trúc Các mẫu thử nghiên cứu DBMS th−ơng mại Integrity Lock Mitre TRUDATA Kernelized Sea View Oracle Replicated NRL Trusted Subject A1 Secure DBMS (ASD) Sybase Informix Ingres Oracle DEC Rubix 46
  48. ♣ Kiến trúc Trusted Subject (kiến trúc chủ thể tin cậy) Kiến trúc chủ thể tin cậy đ−ợc minh hoạ trong hình 1. Một tập hợp các UFE (untrusted front end) đ−ợc sử dụng để t−ơng tác với ng−ời sử dụng, với các mức cho phép khác nhau (Nh− đã đ−ợc trình bày trong hình vẽ, có mức cao và mức thấp). Khi một DBMS tin cậy đ−ợc sử dụng và hoạt động nh− là một chủ thể tin cậy đối với OS, thì nó cũng đ−ợc tin cậy, nó thực hiện các truy nhập vật lý vào cơ sở dữ liệu. Hoạt động nh− là một chủ thể tin cậy của OS có nghĩa là đ−ợc miễn một hoặc nhiều khía cạnh nào đó trong chính sách an toàn của OS, nói chung, đ−ợc miễn các kiểm soát bắt buộc. DBMS và OS phải đ−ợc nhìn nhận nh− là một thực thể, nếu hiểu theo nghĩa thông th−ờng, chúng đ−ợc −ớc tính để xác định mức bảo vệ. Trong kiến trúc này, DBMS có trách nhiệm trong việc bảo vệ đa mức các đối t−ợng của cơ sở dữ liệu. 47
  49. High User Low User Untrusted Untrusted Front End Front End DBMS tin cậy (Trusted DBMS) OS tin cậy (Trusted OS) Cơ sở dữ liệu (DBMS &NON- DBMS DATA) Hình 1 Kiến trúc chủ thể tin cậy L−ới an toàn đ−ợc xây dựng theo cách nh− vậy, định nghĩa mức High, mức Low và một mức DBMS không thích hợp với High và Low. Nhãn DBMS đ−ợc gán cho cả các đối t−ợng và chủ thể. Chỉ có các chủ thể của DBMS có thể thực hiện các ch−ơng trình và truy nhập dữ liệu với một nhãn DBMS. Hơn nữa, các chủ thể (có nhãn DBMS) đ−ợc xem nh− là các chủ thể tin cậy và đ−ợc miễn các kiểm soát bắt buộc của OS. Theo giải pháp này, có thể nhóm các yếu tố có cùng mức nhạy cảm và l−u giữ chúng trong một đối t−ợng với mức chi tiết thô, chỉ gán một nhãn cho đối t−ợng này, hoặc gán nhãn cho từng đối t−ợng (ví dụ, các bộ, các giá trị). Sybase DBMS tuân theo giải pháp này, với kiến trúc máy khách/máy chủ. Sybase thực hiện gán nhãn mức bộ. 48
  50. ♣ Các kiến trúc Woods Hole Các kiến trúc Woods Hole đ−ợc phân loại nh− sau: ắ Kiến trúc Integrity Lock ắ Kiến trúc Kernelized ắ Kiến trúc Replicated (còn đ−ợc gọi là kiến trúc Distributed) Chúng có thể đ−ợc miêu tả thông qua một kiến trúc tổng quát, đ−ợc minh hoạ trong hình 2. High User Low User Untrusted Untrusted Front End Front End Trusted Front End (Bộ giám sát tham chiếu) DBMS không tin cậy Cơ sở dữ liệu Hình 2 Các kiến trúc Woods Hole 49
  51. Chúng ta nhận thấy rằng một tập hợp các UFE t−ơng tác với những ng−ời sử dụng hoạt động tại các mức cho phép khác nhau, ở đây chúng đ−ợc đơn giản hoá thành High và Low. Lần l−ợt, UFE t−ơng tác với một TFE (trusted front end), nó hoạt động nh− một bộ giám sát tham chiếu; Có nghĩa là không thể bỏ qua nó. TFE t−ơng tác với một UBED (untrusted back end DBMS), có trách nhiệm trong việc truy nhập dữ liệu vào cơ sở dữ liệu. Tiếp theo chúng ta mô tả các đặc điểm của từng kiến trúc. • Kiến trúc Integrity Lock Kiến trúc này đ−ợc trình bày trong hình sau đây. 50
  52. High User Low User Untrusted Untrusted Front End Front End Bộ lọc tin cậy (Trusted filter) (Cryptographic unit) Gắn tem K.tra tem L−u giữ Đáp ứng DBMS không tin cậy (Untrusted DBMS) Cơ sở dữ liệu Hình 3 Kiến trúc Integrity Lock Theo giải pháp này, ng−ời sử dụng đ−ợc kết nối thông qua các giao diện front end không tin cậy, thực hiện tiền xử lý và hậu xử lý các câu truy vấn. Một TFE (còn đ−ợc gọi là một bộ lọc tin cậy) đ−ợc chèn vào giữa các UFE và DBMS không tin cậy. TFE có trách nhiệm trong việc tuân theo các chức năng an toàn và bảo vệ đa mức, hoạt động nh− là một TCB. TFE tuân theo bảo vệ đa mức bằng cách gắn nhãn an toàn cho các đối t−ợng của cơ sở dữ liệu, theo các dạng tem. Tem là một tr−ờng đặc biệt của một đối t−ợng, l−u giữ các thông tin (liên quan đến nhãn an 51
  53. toàn và các dữ liệu kiểm soát liên quan khác) trong một khuôn dạng đã đ−ợc mã hoá, đ−ợc tạo ra bằng cách sử dụng một kỹ thuật niêm phong mật mã (cryptoseal mechanism), đ−ợc gọi là Integrity Lock. TFE tiến hành tạo và phê chuẩn các tem, ngay khi dữ liệu đ−ợc l−u giữ và nhận đ−ợc từ cơ sở dữ liệu. TFE sinh ra các tem, bằng cách sử dụng các kỹ thuật tổng kiểm tra (checksum) (Nó sử dụng một hoặc nhiều khoá bí mật, chỉ duy nhất TFE biết đ−ợc khoá này), bao quanh dữ liệu và đ−ợc l−u giữ trong cơ sở dữ liệu theo một khuôn dạng đã đ−ợc mã hoá. Tại thời điểm nhận lại, TFE tính toán lại các tem và so khớp với bản đ−ợc l−u giữ, để phát hiện ra sự sai khớp, tr−ớc khi dữ liệu đ−ợc chuyển cho ng−ời sử dụng. TFE có trách nhiệm tạo ra các bản ghi kiểm toán của riêng nó (có thể có cùng khuôn dạng với các bản ghi kiểm toán đ−ợc OS tạo ra), để đảm bảo tính sẵn sàng của một vết kiểm toán thuần nhất. Thậm chí, nếu tuân theo cơ chế dựa vào tem (stamp-based machanism) một cách chính xác, thì cũng ch−a đủ đảm bảo an toàn. Trong thực tế, nó chỉ đảm bảo cho các tr−ờng hợp sau không xảy ra: truy nhập trực tiếp vào dữ liệu không đ−ợc phép (hay là truy nhập trái phép dữ liệu), chuyển các thông tin không đ−ợc phép vào các lớp phân loại không chính xác (thông qua con ngựa thành Tơroa).Với kiểu kiến trúc này, để tránh đ−ợc các đe doạ trên, các phép chọn (selections), phép chiếu (projections), xử lý câu truy vấn phụ (subquery handling), tối −u câu truy vấn (query optimization) và các phép thống kê (statistical operations) phải đ−ợc cài vào trong TFE hoặc UFE, không đ−ợc cài vào DBMS, DBMS chỉ có trách nhiệm đối với các phép toán l−u giữ và lấy lại. Theo cách này, TFE xem tất cả các dữ liệu (đ−ợc yêu cầu) để trả lời câu truy vấn và đ−ợc phép loại trừ khung nhìn dữ liệu (đ−ợc trả lại), ng−ời sử dụng không đ−ợc biết dữ liệu này. Một giải pháp dành cho việc loại trừ các rủi ro suy diễn đã đ−ợc đề xuất năm 1985, trong đó, một bộ lọc thay thế (commutative filter) đ−ợc chèn vào giữa DBMS và ng−ời sử dụng, đảm bảo loại trừ đ−ợc các đe doạ suy diễn, DBMS tránh đ−ợc con ngựa thành Tơroa. Giải pháp này xuất phát từ giải pháp Maximal Authorized View (1977). Theo Maximal Authorized View, mỗi câu truy vấn q đ−ợc −ớc l−ợng dựa vào một khung nhìn của cơ sở dữ liệu, cơ sở dữ liệu này chỉ bao gồm dữ liệu mà ng−ời sử dụng đã biết (đ−ợc gọi là khung nhìn đ−ợc phép tối đa, nó là một tập hợp con 52
  54. của dữ liệu đ−ợc l−u giữ trong cơ sở dữ liệu), đ−a ra nguồn gốc cho một câu truy vấn qsec, tránh suy diễn trên dữ liệu không đ−ợc phép. User q 1 q2 Bô lọc front-end tin cậy ( Trusted front- end filter) DBMS Cơ sở dữ liệu Hình 4 Giải pháp bộ lọc thay thế. Bộ lọc back-end (còn đ−ợc gọi là bộ lọc quản lý dữ liệu) có trách nhiệm trong việc định nghĩa khung nhìn đ−ợc phép tối đa, bằng cách phát hiện tất cả các bản ghi/các thuộc tính không đ−ợc phép, thay thế các yếu tố không đ−ợc phép bằng giá trị 0. Bộ lọc front-end của kiến trúc đ−ợc trình bày trong hình 4. làm việc theo cách nh− vậy, câu truy vấn q2 (đ−ợc trả lại cho ng−ời sử dụng) t−ơng đ−ơng với câu truy vấn qsec của kiến trúc trong hình 5., bằng cách bổ sung thêm cho câu truy vấn q (đây là câu truy vấn ban đầu của ng−ời sử dụng) thông tin về tem (đ−a ra nguồn gốc cho câu truy vấn q1) và lọc câu truy vấn q2 từ đáp ứng của câu truy vấn q1 . 53
  55. User q qsec Bộ lọc front-end (Front- end filter) DBMS Bộ lọc back-end (Back- end filter) Cơ sở dữ liệu Hình 5 Giải pháp khung nhìn cho phép tối đa • Kiến trúc Kernelized Kiến trúc này đ−ợc trình bày trong hình 6. 55
  56. High User Low User Front- end tin cậy Front- end tin cậy (Trusted Front End) (Trusted Front End) High DBMS Low DBMS OS tin cậy (Trusted OS) Cơ sở dữ liệu (high&low) data Hình 6 Kiến trúc Kernelized ở đây có sử dụng một OS tin cậy, nó có trách nhiệm đối với các truy nhập vật lý vào dữ liệu (trong cơ sở dữ liệu) và có trách nhiệm tuân theo bảo vệ bắt buộc. High User (ng−ời sử dụng làm việc ở mức cao) t−ơng tác với một High DBMS, thông qua một TFE, Low User (ng−ời sử dụng làm việc ở mức thấp) t−ơng tác với một Low DBMS. Sau đó, các yêu cầu của họ đ−ợc chuyển cho OS, nó lấy lại dữ liệu hợp lệ từ cơ sở dữ liệu. Theo giải pháp này, các đối t−ợng (có các nhãn an toàn giống nhau) của cơ sở dữ liệu đ−ợc l−u giữ trong các đối t−ợng của OS tin cậy (đóng vai trò nh− là các kho chứa đối t−ợng của cơ sở dữ liệu). Vì vậy, OS tin cậy tiến hành kiểm soát an toàn trên các đối t−ợng này, cần có các quá trình phân tách và khôi phục quan hệ đa 56
  57. mức. Quá trình phân tách đ−ợc thực hiện khi chuyển đổi một quan hệ đa mức thành một số quan hệ đơn mức, khi chỉ chứa dữ liệu ở một mức an toàn xác định nào đó, chúng đ−ợc l−u giữ trong các đối t−ợng của hệ điều hành. Quá trình khôi phục đ−ợc thực hiện trên các quan hệ đơn mức khi chúng đ−ợc lấy lại, nhằm sinh ra một khung nhìn đa mức chỉ chứa các dữ liệu mà ng−ời sử dụng (ng−ời yêu cầu câu truy vấn) đã biết. Các thuật toán phân tách và khôi phục phải đ−ợc định nghĩa chính xác, nhằm đảm bảo tính đúng đắn và hiệu quả của hệ thống. Các bản ghi kiểm toán (đ−ợc OS tin cậy sinh ra cho các phép toán liên quan đến truy nhập vào các đối t−ợng của OS) và các bản ghi kiểm toán khác phải đ−ợc sinh ra cho các phép toán của DBMS và chúng đ−ợc ghi lại trong một vết kiểm toán mức hệ thống cao, có thể có cùng khuôn dạng với các bản ghi kiểm toán của OS. Kiến trúc này đ−ợc sử dụng trong mẫu thử nghiên cứu Sea View và DBMS Oracle th−ơng mại. • Kiến trúc Replicated (lặp) Kiến trúc này đ−ợc trình bày trong hình 7. Theo giải pháp này, dữ liệu mức thấp đ−ợc lặp trong cơ sở dữ liệu. Theo cách này, ng−ời dùng mức thấp chỉ đ−ợc phép truy nhập vào cơ sở dữ liệu độ −u tiên thấp, không có khả năng sửa đổi dữ liệu mức cao. Để tuân theo giải pháp này cần có các thuật toán đồng bộ an toàn để đảm bảo tính t−ơng thích lặp và chi phí (do lặp) tăng dần theo kích cỡ của l−ới an toàn. Không một DBMS th−ơng mại nào sử dụng kiến trúc này vì nó rất đắt, do phải lặp dữ liệu; Nó chỉ đ−ợc sử dụng trong mẫu thử nghiên cứu NRL. 57
  58. High User Low User Front- end tin cậy Front- end tin cậy (Trusted Front End) (Trusted Front End) High DBMS Low DBMS Cơ sở dữ liệu Cơ sở dữ liệu (high&low) data (low data) Hình 7 Kiến trúc Replicated • Nhận xét về các kiến trúc an toàn Các kiến trúc an toàn đ−ợc trình bày ở trên thích hợp cho các mục đích khác nhau, tuỳ thuộc vào các đặc điểm và các yêu cầu của miền ứng dụng đích. Ví dụ, kiến trúc Kernelized phù hợp với các môi tr−ờng có yêu cầu bảng đơn mức, bởi vì nó kinh tế nhất và dễ thực hiện nhất. Đối với những môi tr−ờng mà DBMS đã định rõ đặc điểm yêu cầu nhãn mềm dẻo và một mức tích hợp cao giữa DBMS và OS cơ sở, kiến trúc Integrity Lock phù hợp hơn cả. Kiến trúc chủ thể tin cậy thích hợp với các miền ứng dụng (đây là nơi có thể đảm bảo một đ−ờng dẫn tin cậy từ các ứng dụng đến DBMS). Khi đánh giá mức tin cậy của các kiến trúc, l−u ý rằng độ phức tạp trong vấn đề đánh giá phụ thuộc vào kiến trúc. Ví dụ, kiến trúc Integrity Lock đ−ợc phê chuẩn một cách dễ dàng nhất, trong khi đó kiến trúc chủ thể tin cậy thì phức tạp hơn. Thực vậy, trong khi chỉ với một bộ lọc kích cỡ nhỏ, bao gồm các dịch vụ thông 58
  59. th−ờng do một OS tin cậy cung cấp, chúng ta lại phải đánh giá một DBMS tin cậy. Kiến trúc Kernelized nằm ở vị trí trung gian, nh−ng nếu phải bổ sung thêm phần mềm tin cậy nhằm đảm bảo hoạt động an toàn trong một môi tr−ờng đa mức, thì việc đánh giá trở nên khó khăn hơn. Còn một vấn đề khác liên quan đến mức độ phụ thuộc giữa DBMS và OS cơ sở tin cậy. Các kiến trúc Integrity Lock và Kernelized dựa vào các dịch vụ an toàn do OS cơ sở tin cậy cung cấp, trong khi đó kiến trúc chủ thể tin cậy đ−a ra một mức phụ thuộc và tích hợp thấp hơn. Khi gán độ chi tiết, có nghĩa là đối t−ợng nhỏ nhất của cơ sở dữ liệu có thể đ−ợc gán một nhãn. Các kiến trúc tiến hành gán khác nhau. Ví dụ, kiến trúc Integrity Lock và kiến trúc thực thể tin cậy cung cấp khả năng gán nhãn hàng, trong khi đó việc gán nhãn của kiến trúc Kernelized do OS cung cấp, trên các đối t−ợng có trong kho chứa của nó, vì vậy giảm tổng chi phí l−u giữ. Tuy nhiên, cơ chế gán nhãn sau sẽ không thích hợp nếu cần phải quản lý các bảng đa mức. Hơn nữa, kiến trúc Integrity Lock và kiến trúc chủ thể tin cậy có thể đ−ợc mở rộng chính đáng, nhằm hỗ trợ cho việc gán nhãn tại mức tr−ờng của một hàng, trong khi đó kiến trúc Kernelized lại không cần. 2. 4 Thiết kế các cơ sở dữ liệu an toàn An toàn cơ sở dữ liệu có thể đ−ợc nhìn nhận nh− là một yêu cầu thứ hai (đ−ợc bổ sung thêm vào các hệ thống hiện có) hoặc đ−ợc coi nh− là một đòi hỏi chủ yếu. Chính vì vậy, nó đ−ợc coi là một yêu cầu thích đáng trong các giai đoạn thiết kế hệ thống ban đầu. Trong hầu hết các tr−ờng hợp, an toàn không phải là một mối quan tâm chủ yếu trong việc phát triển hệ thống. Nhờ đó, các hệ thống sẽ trở nên phong phú thêm với các gói an toàn, đ−a ra các đặc tr−ng an toàn cơ bản mức OS (xác thực ng−ời dùng, kiểm soát truy nhập, kiểm toán). Điều này đã xảy ra đối với nhiều OS đ−ợc sử dụng rộng rãi, chẳng hạn nh− MVS, VMS và VM, an toàn đ−ợc hỗ trợ thông qua các gói RACF, Top Secret và CA-ACF2. Trong một số môi tr−ờng (ví dụ, trong môi tr−ờng quân sự), hệ thống an toàn cần đ−ợc định nghĩa một cách phi thể thức và các yêu cầu bảo vệ đ−ợc kiểm tra một cách hình thức. Trong bất kỳ tr−ờng hợp nào, khi thiết kế các hệ thống an toàn cơ sở dữ liệu, chúng ta phải đối mặt với rất nhiều vấn đề trọng yếu và nhiều vấn đề nghiên cứu còn bị bỏ ngỏ. 59
  60. Tiêu chuẩn DoD bao gồm các chuẩn tham chiếu hữu ích cho việc phân loại hệ thống phần mềm an toàn, đồng thời cung cấp h−ớng dẫn cho việc thiết kế an toàn. Trong thực tế, tại mỗi mức phân loại, với một tập hợp các yêu cầu đã đ−ợc mô tả, nếu chúng đ−ợc quan tâm trong quá trình thiết kế hệ thống thì có thể đảm bảo đ−ợc hiệu suất mong muốn. Nói riêng, tiêu chuẩn DoD trình bày một cách rõ ràng một tập hợp các yêu cầu thiết yếu nên đ−ợc thực hiện khi thiết kế hệ thống, liên quan đến việc định nghĩa mô hình khái niệm của các yêu cầu bảo vệ hệ thống và các chính sách an toàn hệ thống (bắt buộc và tuỳ ý), chúng có thể đ−ợc sửa đổi và kiểm tra thử nghiệm, bằng cách sử dụng các kỹ thuật kiểm tra hình thức. Hơn nữa, rõ ràng là tiêu chuẩn DoD liên quan tới một TCB, nó đ−ợc sử dụng để tuân theo các chính sách và dàn xếp tất cả các truy nhập vào dữ liệu. Từ các mối quan tâm trên, chúng ta có thể đảm bảo an toàn bằng cách xác định rõ các yêu cầu bảo vệ của một hệ thống và sau đó thực hiện các cơ chế an toàn có sử dụng các ph−ơng pháp và các kỹ thuật đã đ−ợc trang bị. Một h−ớng tiếp cận mang tính ph−ơng pháp luận (trong đó tham chiếu rõ ràng vào các yêu cầu của DoD) có thể là một câu trả lời cho vấn đề thiết kế cơ sở dữ liệu an toàn với các đặc tính an toàn, thông qua các giai đoạn phát triển ban đầu. Một ph−ơng pháp luận đa giai đoạn trình bày một h−ớng tiếp cận thích hợp cho việc thiết kế cơ sở dữ liệu an toàn, cho phép các nhà thiết kế xác định một cách chính xác các yêu cầu an toàn của một môi tr−ờng. Trong thực tế, việc tiếp cận thiết kế cơ sở dữ liệu an toàn bắt đầu từ các chức năng an toàn (do OS và DBMS đ−a ra) là không thoả đáng, mặc dù các gói và các sản phẩm an toàn đã có sẵn và có thể đ−ợc xem xét đến. T−ơng tự, ngày nay không ai muốn thiết kế một cơ sở dữ liệu bắt đầu từ một DBMS xác định. Hơn nữa, chúng ta đã đ−a ra các mô hình, các cơ chế và các gói h−ớng tập trung vào các vấn đề an toàn. Mô hình là một cách hình thức hoá việc miêu tả các yêu cầu và các chính sách an toàn của hệ thống; Các cơ chế của OS cung cấp các chức năng an toàn cơ bản (ví dụ: nhận dạng/xác thực, kiểm soát truy nhập); Cuối cùng, các gói và các DBMS an toàn đã mở rộng chức năng của OS, nhằm quản lý các yêu cầu an toàn của cơ sở dữ liệu. Các mô hình, cơ chế và sản phẩm an toàn hình thành một ph−ơng pháp luận tích hợp đa giai đoạn (integrated multiphase methodology), hỗ trợ phát triển (một cách có hệ thống) các hệ thống cơ sở dữ liệu an toàn thông qua các giai đoạn phân tích và thiết kế ban đầu. Nói riêng, ph−ơng pháp luận h−ớng 60
  61. dẫn các nhà phát triển trong quá trình phân tích các yêu cầu an toàn, lựa chọn các chính sách an toàn, định nghĩa một mô hình an toàn và thiết kế các cơ chế an toàn để thực hiện mô hình, quan tâm đến các tính năng an toàn hiện tại của OS và DBMS. Ph−ơng pháp luận (chúng ta đề xuất khi thiết kế cơ sở dữ liệu an toàn) dựa trên các nguyên tắc (do tiêu chuẩn DoD đ−a ra), bao gồm các giai đoạn sau: (1) Phân tích sơ bộ (2) Các yêu cầu và các chính sách an toàn (3) Thiết kế khái niệm (4) Thiết kế lôgíc (5) Thiết kế vật lý Tất cả đ−ợc trình bày trong hình 8. Ph−ơng pháp luận phát triển đa giai đoạn mang lại rất nhiều lợi ích. Tr−ớc hết, nó có thể chia nhỏ quá trình thiết kế (nói chung, đây là một nhiệm vụ phức tạp) thành các nhiệm vụ nhỏ hơn, vì vậy, nó cho phép các nhà phát triển tập trung vào các khía cạnh an toàn riêng của từng nhiệm vụ. Hơn nữa, một h−ớng tiếp cận mang tính ph−ơng pháp luận tách chính sách an toàn ra khỏi các cơ chế an toàn. Chính sách là các nguyên tắc ở mức cao, bắt buộc phải tuân theo trong các quá trình thiết kế, thực thi và quản lý hệ thống an toàn. Chúng đ−a ra các yêu cầu bảo vệ và các chiến l−ợc có thể có khi bảo vệ thông tin của các tổ chức. Hiện có rất nhiều các chính sách kiểm soát an toàn khác nhau, chúng đ−a ra các đòi hỏi/các chiến l−ợc bảo vệ khác (không mâu thuẫn lẫn nhau), thích hợp với các môi tr−ờng khác nhau. Cơ chế an toàn là một tập hợp các chức năng phần cứng, phần sụn và phần mềm tuân theo các chính sách. Các cơ chế nên đ−ợc kiểm tra dựa trên các yêu cầu an toàn, để chứng minh rằng chúng thực sự tuân theo các đặc tả của chính sách xác định nào đó. Hơn nữa, các cơ chế nên có khả năng tuân theo một số chính sách. 61
  62. Các phân tích sơ bộ (Preliminary analysis) Ngôn ngữ đặc tả Các yêu cầu và các chính sách an toàn (Security requirements and policies) yêu cầu an toàn (Security requirement Thiết kế khái niệm Mô hình khái niệm (Conceptual design) an toàn (Security Conceptual model) Kỹ thuật DBMS (DBMS technology) Mô hình lôgíc Thiết kế lôgíc an toàn (Lôgical design) L−ợc đồ lôgíc (Security Logical an toàn model) (Security Logical schema) Mô hình vật lý an toàn Thiết kế vật lý (Physical design) (Security Physical Các tham số chiếu model) (hiệu năng) Project parameters (performances) Các cơ chế an toàn (Security mechanisms) Thực thi (Implementation) Hình 8 Ph−ơng pháp luận thiết kế CSDL an toàn Khi phát triển hệ thống an toàn, việc tách bạch các chính sách và các cơ chế mang lại một số thuận lợi sau: • Khả năng định nghĩa các nguyên tắc kiểm soát truy nhập; 62
  63. • Khả năng so sánh các chính sách kiểm soát truy nhập khác nhau; hoặc so sánh các cơ chế khác nhau nh−ng dành cho cùng một chính sách; • Khả năng định nghĩa các cơ chế hỗ trợ các chính sách khác nhau; Thuận lợi này trở thành một đòi hỏi quan trọng khi các chính sách thay đổi do các yêu cầu của tổ chức thay đổi. Thứ hai, thuận lợi của ph−ơng pháp luận đa giai đoạn (dựa vào mô hình an toàn khái niệm) là nó có thể chứng minh đ−ợc tính an toàn trong quá trình thiết kế hệ thống. Tính an toàn hệ thống có thể đ−ợc chứng minh, bằng cách chứng minh tính đúng đắn của mô hình an toàn dựa vào các yêu cầu và chứng minh tính đúng đắn của các đặc tả trong cơ chế dựa vào mô hình an toàn. Mô hình an toàn là: • Một công cụ thiết kế nhằm h−ớng dẫn thiết kế hệ thống; • Một cấu trúc dành cho nghiên cứu; Chúng ta có thể nghiên cứu hoặc so sánh các mô hình khái niệm khác nhau, không phụ thuộc vào các chi tiết thực thi. Chúng ta có thể chọn lựa các mô hình khái niệm khác nhau, sao cho phù hợp với thiết kế hiện tại; Hoặc nh− một sự lựa chọn, một mô hình mới có thể đ−ợc phát triển từ việc trộn ghép, phi hình thức, sao cho phù hợp với các yêu cầu của hệ thống; • Một công cụ mang tính giáo khoa nhằm đơn giản hoá việc miêu tả hệ thống; • Một công cụ so sánh/đánh giá cho các hệ thống an toàn khác nhau. Các giai đoạn của ph−ơng pháp luận đ−ợc trình bày trong các mục nhỏ sau đây. 2.4.1. Giai đoạn phân tích sơ bộ Mục đích của giai đoạn này là tiến hành nghiên cứu hệ thống an toàn (sau khi đã quyết định một mức chiến l−ợc), chẳng hạn nh− phân tích những gì có thể xảy ra trong khi phát triển các hệ thống thông tin. Việc nghiên cứu mang tính khả thi này bao gồm: đánh giá các rủi ro, −ớc l−ợng các chi phí thiết kế, phát triển các ứng dụng xác định nào và xác định quyền −u tiên của chúng. Để đảm bảo đ−ợc mục đích này, các phân tích cần quan tâm đến: 63
  64. • Các rủi ro hệ thống (system risks): Đây là các đe doạ đáng kể nhất có thể xảy ra đối với một cơ sở dữ liệu, cần −ớc tính (đánh giá) các hình thức xâm phạm t−ơng ứng và hậu quả của việc mất mát, thông qua các kỹ thuật phân tích rủi ro. Nói chung, các đe doạ điển hình (xảy ra trong các môi tr−ờng ứng dụng hoặc các tổ chức) là: đọc và sửa đổi trái phép dữ liệu, không cho phép (từ chối) ng−ời sử dụng hợp pháp truy nhập. Các hình thức tấn công phụ thuộc vào kiểu đe doạ. Ví dụ, chúng ta có thể phát hiện đ−ợc việc đọc và sửa đổi trái phép dữ liệu, thông qua việc truy nhập vào khu vực l−u giữ vật lý, hoặc thông qua việc sử dụng không đúng đắn của các ch−ơng trình ứng dụng (ví dụ: con ngựa thành Tơroa), hoặc thông qua việc truy nhập vào các l−ợc đồ dữ liệu. • Các đặc tr−ng của môi tr−ờng cơ sở dữ liệu (features of database environment): Chúng ảnh h−ởng đến các yêu cầu bảo vệ và các cơ chế liên quan. Ví dụ, các hệ thống bảo vệ đa mức phù hợp với môi tr−ờng quân sự, nh−ng ch−a chắc đã phù hợp với các môi tr−ờng th−ơng mại, vì khó có thể định nghĩa các mức an toàn dữ liệu/ng−ời sử dụng trong đó. • Khả năng ứng dụng của các sản phẩm an toàn hiện có (applicability of existing security products): Cần phải quan tâm đến tính tiện lợi khi chọn lựa giữa các sản phẩm th−ơng mại hiện có sẵn và việc phát triển một hệ thống an toàn từ trộn ghép. Sự lựa chọn phụ thuộc vào loại hình, mức bảo vệ và khi nào thì an toàn đ−ợc coi nh− là một đặc tr−ng vốn có của cơ sở dữ liệu; hay là một đặc tr−ng bổ sung. • Khả năng tích hợp của các sản phẩm an toàn (Integrability of the security products): Đ−a ra khả năng tích hợp các cơ chế an toàn với các cơ chế phần cứng và phần mềm thực tế. • Hiệu năng đạt đ−ợc của các hệ thống an toàn (performance of the resulting security system): Hiệu năng của các hệ thống an toàn cần đ−ợc so sánh với các hệ thống thực tế, hoặc với các hệ thống mới, mà không cần bất kỳ các cơ chế và các kiểm soát an toàn nào. Kết quả của các phân tích này là một tập hợp các đe doạ dễ xảy ra với một hệ thống, đ−ợc sắp xếp theo quyền −u tiên. Hơn nữa, chúng ta cần đánh giá khả năng 64
  65. áp dụng và tích hợp của các sản phẩm th−ơng mại an toàn với các cơ chế hiện tại, có thể phát triển các cơ chế phi hình thức theo yêu cầu thông qua việc trộn ghép. Giai đoạn tiếp theo của ph−ơng pháp luận đ−ợc thực hiện hay không còn tuỳ thuộc vào các phân tích chi phí/lợi ích có mang lại một kết quả khả quan hay không. 2.4.2 Phân tích yêu cầu và chọn lựa chính sách an toàn Việc phân tích các yêu cầu an toàn bắt đầu từ việc nghiên cứu đầy đủ và chính xác tất cả các đe doạ có thể xảy ra với một hệ thống. Điều này cho phép các nhà thiết kế xác định các yêu cầu an toàn một cách chính xác và đầy đủ, tuỳ thuộc vào các đòi hỏi bảo vệ thực tế của hệ thống. Các cơ sở dữ liệu khác nhau có các đòi hỏi bảo vệ khác nhau (cho các kiểu rủi ro khác nhau). Sự khác nhau đầu tiên xuất phát từ tính nhạy cảm của thông tin, tiếp đến là các luật và dự luật có thể có. Hơn nữa, các hệ thống đ−ợc phân loại thành hệ thống rủi ro cao hoặc hệ thống rủi ro thấp, dựa vào các yếu tố cơ bản, chẳng hạn nh− mức t−ơng quan dữ liệu, chia sẻ dữ liệu, khả năng truy nhập dữ liệu, kỹ năng của nhân viên và các kỹ thuật đ−ợc chọn lựa. Tính t−ơng quan (correlation) xảy ra khi dữ liệu liên quan lẫn nhau, mọi sự thay đổi trên một mục dữ liệu kéo theo sự thay đổi của các mục dữ liệu khác. Tính t−ơng quan cũng xảy ra khi thực hiện các phép đọc trên một mục dữ liệu, vì đồng thời chúng ta cũng biết đ−ợc giá trị của các mục dữ liệu khác. Chia sẻ dữ liệu xảy ra khi nhiều ứng dụng (hoặc nhiều ng−ời sử dụng ) sử dụng chung một mục dữ liệu. Nói riêng trong cơ sở dữ liệu, điều này dẫn đến các vấn đề t−ơng tranh (concurrency problems), nguyên nhân là do có nhiều truy nhập đồng thời vào dữ liệu. Chia sẻ dữ liệu cũng dẫn đến các vấn đề về tính toàn vẹn và tính bí mật dữ liệu. Đối với tính bí mật, nhiều tiến trình (truy nhập vào cùng một mục dữ liệu) có thể biết đ−ợc các thông tin do các tiến trình khác đã chèn vào tr−ớc đó, ảnh h−ởng đến tính toàn vẹn dữ liệu, do các sửa đổi dữ liệu không chính xác (chủ tâm hoặc vô ý), điều này ảnh h−ởng đến tính đúng đắn của các tiến trình khác khi chúng sử dụng dữ liệu. 65