Giáo trình Xây dựng mô hình liên quan định lượng giữa cấu trúc và tác dụng ứng dụng trong sàng lọc tìm kiếm chất ức chế histon deacetylase
Bạn đang xem tài liệu "Giáo trình Xây dựng mô hình liên quan định lượng giữa cấu trúc và tác dụng ứng dụng trong sàng lọc tìm kiếm chất ức chế histon deacetylase", để tải tài liệu gốc về máy bạn click vào nút DOWNLOAD ở trên
Tài liệu đính kèm:
- giao_trinh_xay_dung_mo_hinh_lien_quan_dinh_luong_giua_cau_tr.pdf
Nội dung text: Giáo trình Xây dựng mô hình liên quan định lượng giữa cấu trúc và tác dụng ứng dụng trong sàng lọc tìm kiếm chất ức chế histon deacetylase
- Tạp chí Khoa học ĐHQGHN: Khoa học Y Dược, Tập 32, Số 2 (2016) 10-16 Xây dựng mô hình liên quan định lượng giữa cấu trúc và tác dụng ứng dụng trong sàng lọc tìm kiếm chất ức chế histon deacetylase 1 2 1 Phạm Thế Hải , Đoàn Việt Nga , Nguyễn Thị Ngọc , Bùi Thanh Tùng2, Lê Thị Thu Hường2,* 1Đại học Dược Hà Nội, 13-15 Lê Thánh Tông, Hà Nội, Việt Nam 2Khoa Y dược, Đại học Quốc gia Hà Nội, 144 Xuân Thủy, Cầu Giấy, Hà Nội, Việt Nam Tóm tắt Ung thư hiện nay là mối quan tâm hàng đầu trên thế giới với rất nhiều nghiên cứu đã được thực hiện nhằm tìm kiếm hợp chất có khả năng điều trị trúng đích. Enzyme histon deacetylase (HDAC) được đánh giá là một trong những đích phân tử quan trọng nhất. Trong nghiên cứu này, chúng tôi đã phát triển và đánh giá mô hình QSAR để xác định hoạt tính của các hợp chất có khả năng ức chế HDAC2 chỉ dựa trên cấu trúc phân tử. Nghiên cứu sử dụng mô tả phân tử DRAGON, kỹ thuật LDA với phần mềm STATISTICA 10.0 để xây dựng mô hình. Mô hình này được đánh giá với độ chính xác hơn 86% và đảm bảo các nguyên tắc OECD. Phương pháp này giúp cho quá trình nghiên cứu phân loại, sàng lọc được nhanh, giảm chi phí và tăng hiệu quả. Ngoài ra, các kết quả đạt được tạo cơ sở cho việc phát hiện và thiết kế hợp chất mới ức chế HDAC2, hướng tới phát triển thành thuốc điều trị ung thư nhắm đích. Nhận ngày 16 tháng 9 năm 2015, Chỉnh sửa ngày 07 tháng 10 năm 2015, Chấp nhận đăng ngày 05 tháng 12 năm 2016 Từ khóa: Histone deacetylase 2; định lượng mối quan hệ giữa cấu trúc và hoạt tính; mô tả phân tử DRAGON; LDA; STATISTICA. 1. Đặt vấn đề* [1]. Việc ức chế enzyme HDAC2 sẽ giúp ngăn chặn quá trình tổng hợp ADN từ đó ngăn chặn Trên thế giới hiện nay, đẩy lùi căn bệnh ung tế bào ung thư phát triển [2]. Tại Việt Nam, đã thư luôn là vấn đề được đặt lên hàng đầu. Đã có có một số nghiên cứu tìm kiếm các hợp chất rất nhiều nghiên cứu trước đây nhằm tìm kiếm mới có khả năng ức chế HDAC2 và đưa ra một các hợp chất điều trị nhắm đích phân tử. Trong hướng mới trong tìm kiếm các thuốc điều trị nghiên cứu này, chúng tôi đã xác định và lựa ung thư [3-7]. Tuy nhiên, các phương pháp này chọn đích phân tử là enzyme histone còn tốn nhiều thời gian và kinh phí. Vì vậy, để deacetylase 2 (HDAC2), một enzyme quan tiết kiệm và nâng cao hiệu quả nghiên cứu, trọng thuộc họ HDAC có chức năng loại bỏ chúng tôi đã tính toán các tham số phân tử dựa nhóm nhóm acetyl từ -N-acetyl lysin amino vào đặc điểm cấu trúc và từ đó xây dựng thành acid của phần histon trong cấu trúc của gen công mô hình định lượng giữa cấu trúc và hoạt tính sinh học (QSAR - quantitive structure ___ activity relationship). Trên cơ sở đó, việc sàng * Tác giả liên hệ. ĐT: 84-4-37450188 lọc và định hướng phát triển hợp chất ức chế Email: ltthuong1017@gmail.com 1 0
- P.T. Hải và nnk. / Tạp chí Khoa học ĐHQGHN: Khoa học Y Dược, Tập 32, Số 2 (2016) 10-16 11 HDAC2 trở nên dễ dàng và hiệu quả hơn, tạo dòng SMILES (Simplified Molecular Input Line tiền đề cho bước nghiên cứu hợp chất chữa ung Entry System) bằng việc sử dụng phần mềm thư nhắm đích tiếp theo. ChemDraw v.10.0 [10]. Căn cứ vào các mã code, hơn 2000 mô tả phân tử thuộc họ 0D, 1D và 2D được tính toán bằng phần mềm Dragon 2. Nguyên liệu và phương pháp nghiên cứu v.6.0 [11]. Để tính toán mô tả phân tử, tối ưu hóa cấu trúc bán thực nghiệm đã được thực hiện 2.1. Nguyên liệu cho mỗi hợp chất. Quy trình này được thực hiện dựa trên các thuật toán Polak - Ribiere sử dụng Cơ sở dữ liệu ChemBL và thông tin từ các trong HyperChemv.8.0 [12]. Thuật toán tối bài báo cáo khoa học có liên quan trước đây thiểu hóa năng lượng thông qua việc thay đổi được khai thác và kiểm tra để chuẩn bị cơ sở dữ cấu trúc không gian phân tử để đạt năng lượng liệu (CSDL) đủ lớn và đa dạng các chất có hoạt thấp nhất, tăng độ bền cho hợp chất [13]. tính ức chế HDAC2. CSDL đầu tiên gồm 1181 2.2.2. Thiết kế tập huấn luyện và tập kiểm tra hợp chất có hoạt tính sinh học được xác định Sau khi tính toán mô tả phân tử, CSDL qua nồng độ ức chế 50% đối tượng thử (IC50 - được chia thành tập huấn luyện (TS - training inhibitor concentration 50%), hằng số ức chế set) và tập kiểm tra (PS - prediction set), sử (Ki) hoặc thông số khác. Sau đó, 184 hợp chất dụng phương pháp phân tích cụm k-MCA (k- được thêm vào có hoạt tính ức chế cả HDAC1 mean cluster analysis) với phần mềm và HDAC2. Cuối cùng, CSDL được xây dựng STATISTICA 10.0 [14]. Tập huấn luyện bao gồm 1471 hợp chất trong đó 715 hợp chất có (chiếm 75% CSDL) được sử dụng cho việc xây hoạt tính ức chế HDAC2 và 756 hợp chất giống dựng (huấn luyện) mô hình. Tập huấn luyện thuốc [8] nhưng không có hoạt tính ức chế. cho phép phát hiện mối quan hệ có khả năng dự đoán. Còn tập kiểm tra bao gồm các phân tử mà 2.2. Phương pháp mô hình chưa bao giờ gặp được sử dụng để đánh giá độ mạnh và khả năng ngoại suy của Mô hình QSAR biểu diễn mối liên hệ giữa các các mô hình xây dựng được. cấu trúc và tác dụng sinh học của các chất dưới 2.2.3. Phát triển mô hình biểu thức toán học. Để xây dựng được các mô Nghiên cứu sử dụng kỹ thuật phân tích sự hình này thì cả cấu trúc và tác dụng sinh học khác biệt tuyến tính (LDA - linear discriminant đều phải được định lượng hóa. Mô hình analysis) để xác định mối quan hệ giữa tham số QSARcó dạng: Y = a1(x1) + a2(x2)+ + an(xn). phân tử và hoạt tính ức chế. Trong đó, Y là biến đáp ứng (mang 2 giá trị: +1 Lựa chọn tham số phân tử: Kỹ thuật đưa đối với các hợp chất có tác dụng ức chế vào dần từng bước các biến (FS - Forward HDAC2 và -1 đối với các hợp chất không có stepwise) được sử dụng để lựa chọn bước đầu tác dụng ức chế HDAC2); x1, x2 , xn là các tập hợp các tham số phân tử. Đây là thuật toán tham số phân tử đặc trưng cho cấu trúc; a1, kết hợp dần dần với một biến mới dựa trên trị a2, an là các hằng số thể hiện trọng số của từng số p và tỷ lệ phân phối Fisher (F). Sau đó, tham số phân tử xi đối với tác dụng sinh học. nghiên cứu đã dùng phương pháp tập hợp con 2.2.1. Tính toán tham số mô tả phân tử tốt nhất (BS - best subset), tính giá trị lambda Tham số mô tả phân tử là kết quả của một Wilks (λ) để lựa chọn các tham số phân tử có quá trình toán học và logic chuyển đổi thông tin khả năng dự đoán hoạt tính tốt. được mã hóa trong cấu trúc hóa học thành một Phát triển mô hình: Mô hình LDA được tối số có khả năng đặc trưng cho phân tử đấy [9]. ưu hóa và phát triển bằng phương pháp phân Để thực hiện tính toán, tất cả các cấu trúc của tích sự khác biệt tuyến tính tổng quát (GLDA - CSDL được chuyển đổi thành hệ thống đơn General Linear Discriminant Analysis) trong giản hóa với đầu vào được biểu diễn dưới dạng STATISTICA 10.0 dựa trên lý thuyết xác suất
- 12 P.T. Hải và nnk. / Tạp chí Khoa học ĐHQGHN: Khoa học Y Dược, Tập 32, Số 2 (2016) 10-16 thống kê. Ở đây, phương pháp phân bố tuyến các hợp chất được lựa chọn để xây dựng thành tính Fisher được sử dụng để giải quyết vấn đề TS. Kết quả, 536 hợp chất có hoạt tính và 676 phân loại. hợp chất không có hoạt tính được chọn vào TS; Mô hình tốt nhất đối với mỗi kỹ thuật được 368 hợp chất còn lại được xếp vào PS. lựa chọn dựa vào các thông số thống kê khi Mô hình LDA (M1): Kết quả đã lựa chọn đánh giá trên TS và PS là: độ chính xác hay tỉ lệ được 9 tham số mô tả phân tử tốt nhất. Mô hình phần trăm các chẩn đoán chính xác (Ac - có dạng: Accuracy), độ nhạy (Se - Sentivity), độ đặc hiệu Class (+/-) = 29.75 – 1.87 × GATS2e + 2.19 (Sp - Specificity), hệ số tương quan Matthews × nRNHO + 2.29 × Uc – 8.11 × SpMax1_Bh(e) (MCC- matthews correlation coefficient), tỉ lệ +1.13 × C038 – 0.42 × N-067 – 0.53 × GGI3 – dương tính giả (FPrate- False Positive Rate), 7.20 × Eta_epsi_A + 0.89 × nCRX3 (M1) đường cong đặc trưng ROC (Receiver N = 1103; λ = 0.41; Δ2 = 5.77; F = operating characteristic) [15] thông qua thông 130.73; p 0.9 mà 2.2.4 Đánh giá mô hình giá trị AURC càng gần 1 càng tốt; do vậy giá trị Mô hình QSAR được đánh giá theo 5 này cũng cho thấy mô hình có độ chính xác cao. nguyên tắc của OECD như sau: Tóm lại, chúng ta đã có thể chứng minh được (1) Có đích xác định. rằng mô hình LDA - QSAR (M1) được phát (2) Các thuật toán được sử dụng để xây triển từ 9 mô tả phân tử được lựa chọn có độ dựng mô hình rõ ràng (mô hình có thể được tái mạnh, khả năng dự đoán và có ý nghĩa thống xây dựng lại những hợp chất mới). [1-22] kê cao. (3) Có miền cấu trúc ứng dụng (AD - Đánh giá mô hình QSAR: dựa vào 5 applicability domain) được xác định (sử dụng nguyên tắc của OECD đã nêu ở trên phương pháp đòn bẩy). Tiêu chí 1. Ở đây đích xác định là phân loại (4) Thỏa mãn các đánh giá nội trên tập TS các hợp chất thành: nhóm có hoạt tính ức chế để kiểm tra mức độ khớp, độ mạnh và ổn định và nhóm không có hoạt tính ức chế HDAC2 của mô hình. dựa vào nhiều thông số khác nhau như IC50, (5) Giải thích được cơ chế (nếu có thể). phần trăm ức chế (I%) hay Ki. Tiêu chí 2. Thuật toán áp dụng rõ ràng: Các phương pháp xây dựng mô hình trong nghiên 3. Kết quả và bàn luận cứu chúng tôi đã nêu ở phần 2. Do tính rõ ràng và đúng đắn của phương pháp mà các mô hình Đầu tiên, CSDL đã được chia ra thành TS có thể được sử dụng lặp lại để phát hiện các và PS. Các hợp chất có hoạt tính được chia hợp chất mới ức chế HDAC2. thành 10 cụm và các hợp chất không có hoạt Tiêu chí 3. Để đạt được khả năng dự đoán tính thành 12 cụm. Từ mỗi cụm, khoảng 75% tốt trong sàng lọc ảo, việc xác định được AD
- P.T. Hải và nnk. / Tạp chí Khoa học ĐHQGHN: Khoa học Y Dược, Tập 32, Số 2 (2016) 10-16 13 của mô hình QSAR là vô cùng cần thiết. AD có 0.0529; bao gồm cấu trúc có trong phân tử liên thể ứng dụng với tất cả các mô hình đã được kết amide nối triflouromethyl ketone, α- đánh giá bằng phương pháp điểm Williams. aminoanilide, polipeptides và steroids. Ngoài ra, Biểu đồ dưới đây (Hình 1) cho thấy mối quan 4 hợp chất có giá trị đòn bấy rất cao bao gồm: hệ giữa phần dư chuẩn (Standardized Residual - pyrrole-imidazole polymaide SAHA (h = 0.112), xác định bởi LDA) và giá trị “đòn bẩy” cefpodoxime (h = 0.099), I-Coeleneterazine (h = Leverage (h). Chỉ số h cho biết một chất có ảnh 0.094) và ticarcillin (h = 0.066). hưởng tới không gian cấu trúc của biến như thế Bên cạnh đó, nhiều biến không có ý nghĩa ở nào và h được định nghĩa như sau: các mô hình dự đoán trên tập PS và 14 hợp chất T T -1 có giá trị đòn bẩy cao đã bị loại. h = x (X X) x; trong đó xi là vectơ mô tả i i Tiêu chí 4. Kết quả của quá trình đánh giá phân tử, trị số đòn bẩy càng cao thì hiệu quả mô đã được trình bày ở trên với độ chính xác và độ hình càng kém. Giá trị đòn bẩy cảnh báo h* là ổn định khá tốt trên các mô hình. một ngưỡng quan trọng để tham chiếu các dự Tiêu chí 5. Giải thích cơ chế: Giải thích 9 đoán bởi mô hình QSAR cho hợp chất trong TS mô tả phân tử của mô hình M1. và PS; h*= 3×p’/n trong đó n là kích thước của GATS2e: phân bố nguyên tử mang điện âm tập TS và p’ là số lượng các biến mô hình. của các cầu nối có độ dài xác định (lag =2). SpMax1_Bh (e): cung cấp thông tin môi trường điện tử của các nguyên tử có trong mô phỏng cấu trúc phân tử mà đỉnh hydro bị xóa. Eta_epsi_A, GGI3: mô tả được định nghĩa là Σεi / N trong đó εi: nguyên tử thứ i (i = 1, ,N) được tính toán dựa trên phần lõi và hóa trị electron liên kết đến một đỉnh trong mô tả cấu trúc có đỉnh Hydro bị xóa. C-038 và N-067: là hai dạng mô tả phân tử mảnh trung tâm. Thuật ngữ Al đề cập đến nhóm Hình 1. Miền ứng dụng của mô hình QSAR xác định béo (Aliphatic groups) và X là nguyên tử có độ hợp chất có khả năng ức chế HDAC2. âm điện cao (O, S). Tính toán cho thấy các yếu Nguồn: Kết quả xử lý số liệu tố này lại cho hiệu quả ngược lại khi góp mặt trong cấu trúc các chất ức chế HDAC trong khi Sau khi tính toán, ta thấy phần lớn các hợp các nhóm Cacbonyl hoặc cacbothionyl giúp chất trong TS nằm trong miền ứng dụng giới tăng hoạt tính ức chế, trong khi đó nhóm hạn bởi khung vuông ± 3 đối với phần dư chuẩn ketimine cũng cho hiệu quả đóng góp ngược và h* bằng 0.0272. Bảy hợp chất ức chế với hoạt tính một phần. HDAC2 có giá trị dư chuẩn lớn hơn 3: bao gồm nRNHO và nCRX3 liên quan đến số lượng bốn hợp chất được sản xuất hoàn toàn từ vi nhóm hydroxylamine và nhóm thế halogen khuẩn gram âm C.violaceum [16]. Các hợp chất (MHSs- multiple halogen substituents), thành khác có cấu trúc hydroxamate tương đồng với phần cấu trúc đóng góp khá tốt vào hoạt tính ức nhiều hợp chất khác trong TS. 44 hợp chất chế. Dựa vào CSDL các dẫn xuất của acid (gồm 13 hợp chất có hoạt tính và 31 hợp chất hydroxamic với nhóm quan trọng là không có hoạt tính) được tìm thấy trong vùng hydroxylamine, phân tích mối quan hệ cấu trúc vượt quá so với giá trị h*. Các mẫu huấn luyện và hoạt động (SAR – Structure activity này có thể khiến mô hình thống kê có ý nghĩa relationship), chúng tôi xác định được cơ chế kém và chúng nên được xóa khỏi tập huấn tạo phức với Zn2+ của các dẫn chất luyện. Hầu hết các hợp chất được phân bổ liên hydroxylamic tại vị trí hoạt động [20]. Việc tục với giá trị h trong khoảng 0.0273 đến thêm các nhóm thế halogen (Cl, Br, F, CF3 )
- 14 P.T. Hải và nnk. / Tạp chí Khoa học ĐHQGHN: Khoa học Y Dược, Tập 32, Số 2 (2016) 10-16 cũng được nghiên cứu kỹ để thiết kế các hợp xây dựng được giúp phân loại các hợp chất có chất mới. Ngoài ra, theo các nghiên cứu thì hoạt tính sinh học được nhanh chóng và dễ nhóm thế ceton trifluoromethyl cũng được dàng hơn. Mô hình này còn có thể được ứng đánh giá có hoạt tính trong cấu trúc acid dụng để sàng lọc các CSDL lớn nhằm tìm kiếm hydroxamic. Như vậy, MHSs cần được lưu ý các hợp chất ức chế HDAC2. Ngoài ra, kết quả trong thiết kế hợp chất mới thông qua đánh nghiên cứu cũng giúp định hướng thiết kế các giá mô tả phân tử này. hợp chất mới có hoạt tính ức chế cao hơn bằng Uc là một trong những mô tả ảnh hưởng việc tìm ra các mảnh cấu trúc chịu trách nhiệm nhất, có khả năng ức chế HDAC tốt với cấu tăng hoạt tính. Tất cả hướng đến việc tìm kiếm trúc bất bão hòa, được tính như sau Uc = log2 các hợp chất dẫn đường cho quá trình nghiên × (1 + nDB + nTB + nAB) ở đây nDB, nTB cứu và phát triển các thuốc chống ung thư và nAB tương ứng là số liên kết đôi, liên kết hướng đích mới. ba và vòng thơm. Như vậy, để tối đa hóa hoạt tính, chúng tôi tập trung tăng các mảnh cấu trúc nRNHO, Uc, Lời cảm ơn C-038 và nCRX3 song song với việc giảm thiểu GATS2e, SpMax1_Bh (e), N-067, GGI3 và Nghiên cứu được thực hiện trong khuôn Eta_epsi_A; cuối cùng điều kiện tốt nhất cho khổ đề tài Đề tài khoa học và công nghệ cấp từng mô tả đã được xác định như sau: GATS2e ĐHQGHN, mã số QG.16.24. = 0.18, nRNHO = 1 hoặc 2, Uc = 5.33, SpMax1_Bh (e) = 3.80, C-038 = 1 hoặc 2, N- 067 = 0, GGI3 = -0.42, Eta_epsi_A = 0.49 và Tài liệu tham khảo nCRX3 = 1. Tuy nhiên thực tế khó có thể xây dựng được cấu trúc hoàn toàn chính xác từ [1] C. Choudhary, et al., Lysine Acetylation Targets thông số trên nhưng nó cũng đã đưa ra được Protein Complexes and Co-Regulates Major hướng tìm kiếm và phát triển các hợp chất ức Cellular Functions. Science 325 chế HDAC2. (2009) 834. Dựa trên mô hình xây dựng được và vai trò [2] Katrina J. Falkenberg and Ricky W. Johnstone, các mảnh cấu trúc đã xác định, trong bước thiết Histone deacetylases and their inhibitors in kế các hợp chất mới tiếp theo cần tập trung cancer, neurological diseases and immune disorders. Nature Reviews Drug Discovery 13 thêm các nhóm thế halogen (Cl, Br, F ), nhóm (2014) 673. chức cacbothinyl, cacbonyl, hydroxylamin trên [3] Đào Thị Kim Oanh, et al., Tổng hợp N1- các sườn cấu trúc, đặc biệt là dẫn chất của acid (benzo[d]thiazol-2-yl)-N6-hydroxyadipamid và hydroxamic. Cấu trúc bất bão hòa (liên kết đôi, dẫn chất hướng ức chế histon deacetylase. Tạp liên kết ba, vòng thơm) cũng góp phần tăng tính chí Dược học 51 (2011) 55. ức chế HDAC2. Đây chính là các nhóm chức, [4] Đào Thị Kim Oanh, et al., Tổng hợp N1- nhóm thế, phần cấu trúc tiềm năng cốt lõi, cơ sở (benzo[d]thiazol-2-yl)-N8-hydroxyoctandiamid để thiết kế các chất có hoạt tính ức chế mới cần và dẫn chất hướng ức chế histon deacetylase. được chú ý. Tạp chí Dược học 51 (2011) 45. [5] Đào Thị Kim Oanh, Sang-Bea Han, and Nguyễn Hải Nam, Tổng hợp N1-(benzo[d]thiazol-2-yl)- N4-hydroxysuccinamid và dẫn chất hướng ức 4. Kết luận và kiến nghị chế histon deacetylase. Tạp chí Dược học 51 (2011) 47. Nghiên cứu đã xây dựng thành công mô hình [6] Nam N-H, et al., Synthesis, bioevaluation and toán học biểu diễn mối quan hệ định lượng giữa docking study of 5-substitutedphenyl-1,3,4- cấu trúc và tác dụng ức chế enzyme HDAC2 thiadiazole-based hydroxamic acids as histone deacetylase inhibitors and antitumor agents. thỏa mãn cả năm nguyên tắc OECD. Mô hình
- P.T. Hải và nnk. / Tạp chí Khoa học ĐHQGHN: Khoa học Y Dược, Tập 32, Số 2 (2016) 10-16 15 Journal of enzyme inhibition and medicinal [15] C. Wang, et al., Thailandepsins: bacterial chemistry 29 (2013) 611. products with potent histone deacetylase [7] Nam N-H, et al., Novel isatin-based hydroxamic inhibitory activities and broad-spectrum acids as histone deacetylase inhibitors and antiproliferative activities. Journal of Natural antitumor agents. European journal of medicinal products 74 (2011) 2031. chemistry 70 (2013) 477. [16] Huong Le-Thi-Thu, et al., A Comparative Study [8] Iskander Yusof and Matthew D. Segall, of Nonlinear Machine Learning for the “In Considering the Impact of "Drug-like" Silico” Depiction of Tyrosinase Inhibitory Properties on the Chance of Success. Optibrium Activity from Molecular Structure. Molecular Ltd., 7221 Cambridge Research Park, Beach informatics 30 (2011) 527. Drive, Cambridge, CB25 9TL, 2013. [17] Iskander Yusof and Matthew D. Segall, [9] Todeschini, R. and V. Consonni, and H.o.M.D. Considering the Impact of ‘Drug-like’ Properties 1st, Handbook of Molecular Descriptors 1st on the Chance of Success, Drug Discov Wiley VCH; Weinheim, Germany, 2000. Today 18 (2013 ) 659. [10] Prof. Dr. Stefan Bienz, Short Manual to the [18] Huong Le-Thi-Thu, et al., QSAR models for Chemical Drawing Program ChemDraw®. IfC tyrosinase inhibitory activity description Department of Chemistry. applying modern statistical classification [11] Andrea Mauri, et al., DRAGON SOFTWARE: techniques: A comparative study. Chemometrics an easy approach to molecular descriptor and and Intelligent Laboratory Systems 104(2) calculator. MATCH Commun. Math. Comput. (2010) 249. Chem. 56 (2006) 237.[12]. Froimowitz M, [19] D. Hadjipavlou-Litina and E. Pontiki, HyperChem: a software package for Quantitative Structure–Activity Relationship computational chemistry and molecular Studies on Hydroxamic Acids Acting as Histone modeling, Biotechniques 14(6) (1993) 1010. Deacetylase Inhibitors,. Hydroxamic Acids: A [12] Anh, N.T.K., Nghiên cứu giải thích phản ứng Unique Family of Chemicals with Multiple SEAR bằng phần mềm HyperChem 7.54. Khóa Biological Activities, Springer Berlin luận tốt nghiệp, Đại học Sư Phạm Hà Nội, 2011. Heidelberg, Berlin, Heidelberg, 2013. [13] STATISTICA (data analysis software system) [20] Alexander Tropsha and Alexander Golbraikh, Version 8.0.1, StatSoft, Inc., Tulsa, OK, 2012. Handbook of Chemoinformatics Algorithm, Chapter 6. 173-210, CRC Mathematical and [14] F. Provost and T. Fawcett., Analysis and Computational Biology Series, New york, 2010. visualization of classifier performance: comparison under imprecise class and cost [21] OECD Principes for the validation, for Regulatory purposes, of (Quantitative) structure-activity distribution. Third International Conference on th Knowledge Discovery and Data Mining., relationship models, 37 Joint Meeting of the Newport Beach, California, 1997. Chemicals Committee and Working Party on Chemicals, Pesticides and Biotechnology, 2004. Development of Quantitative Structure - Activity Relationship Model for Discovery of Novel Histone Deacetylase 2 Inhibitors 1 2 1 Pham The Hai , Doan Viet Nga , Nguyen Thi Ngoc , Bui Thanh Tung2, Le Thi Thu Huong2 1Hanoi University of Pharmacy, 13-15 Le Thanh Tong, Hanoi, Vietnam 2VNU School of Medicine and Pharmacy, 144 Xuan Thuy, Cau Giay, Hanoi, Vietnam Abstract: Treatment cancer has interested the top of many countries with a lot of investigations for finding novel molecularly targeted compounds. Histon deacetylase (HDAC) was known as an
- 16 P.T. Hải và nnk. / Tạp chí Khoa học ĐHQGHN: Khoa học Y Dược, Tập 32, Số 2 (2016) 10-16 enzyme in epigenetics way; that means it is an important target to explore. In this study, we have developed and validated succesfully QSAR model for the identification of HDAC2 inhibitors only from molecular structures. Firstly, we computally described these molecules by DRAGON software, latter we used LDA approach with STATASTICA 10.0 for buiding model. The OECD principles were used to assess the QSAR model validation. The model accuracy was higher than 86% and this model fulfilled all OECD principles. The developed method helps us saving time, money in screening step in discovery of new lead compounds. Moreover, these results were provided the basis for designing new HDAC2 inhibitor compounds towards developing the targeted cancer theraphy drug. Keywords: Histone Deacetylase 2; Quantitative Structure-Activity Relationship; Molecular Descriptors DRAGON; LDA; STATISTICA.