Перейти к содержимому
UzScite
  • НСИ
    • Новости События
    • Методическая информация
    • Нормативные документы
  • Каталог журналов
  • Указатель авторов
  • Список организаций

Практика и потенциал развития интерпретируемости моделей количественного отношения «структура-активность» (QSAR)

Адылова Ф.Т.

Давронов Р. Р.

Жамилов У. У.

Каюмов О. А.

Проблемы вычислительной и прикладной математики

  • № 5(17) 2018

Страницы: 

7

 – 

26

Язык: русский

Открыть файл статьи
Открыть страницу статьи в Интернет

Аннотация

Достоинство модели QSAR состоит в понимании механизма изучаемого действия, поэтому проблема интерпретируемости модели приобретает особую актуальность.Сегодня есть тысячи молекулярных дескрипторов, доступных для построения моделей QSAR, но дать физико-химическую интерпретацию для многих из них часто невозможно. До недавнего времени применялась схема интерпретации «модельдескриптор-структура», зависящая от набора дескрипторов и методов машинного обучения, что затрудняло интерпретацию моделей, построенных на новейших методах машинного обучения. Выходом стала новая парадигма «модель-структура», обеспечивающая понимание смысла любой модели QSAR. В статье анализируются плюсы и минусы подходов к интерпретации, и в вычислительном эксперименте обосновывается эффективность нового универсального подходак интерпретаци и моделей QSAR.

The advantage of the QSAR model is the revealing of the action mechanism being studied, so the problem of the interpretability of the model is very essential. Today there are thousands of molecular descriptors available for constructing QSAR models, but it is often impossible to give a physic-chemical interpretation to many of them. Until recently, the «model-descriptor-structure»interpretation scheme was used, depending on the set of descriptors and machine learning methods, which made it difficult to interpret models based on the advanced methods of machine learning. The solution of this problem was thenew»model-structure»paradigm, which provides understanding of the meaning of any QSAR model. The article analyzes the pros and cons of approaches to interpretation, and in the computational running, the effectiveness of a new universal approach to the interpretation of QSAR models is justified.

Список использованных источников

  1. Cherkasov A. et.all. QSAR Modeling: Where Have You Been? Where Are You Going To? // Med Chem, 2014. Т.57. №12. С. 4977–5010. doi: http://dx.doi.org/10.1021/jm4004285.
  2. Novotarskyi S. et.all. A comparison of different QSAR approaches to modeling CYP450 1A2 inhibition // J Chem Inf Model, 2007. Т.51. №6. С. 1271–1280. doi: http://dx.doi. org/10.1021/ci200091h
  3. Zhu H. et.all. Combinatorial QSAR Modeling of Chemical Toxicants Tested against Tetrahymena pyriformis // J Chem Inf Model , 2008. Т.48. №4. С. 766–784. doi: http: //dx.doi.org/10.1021/ci700443v.
  4. Guha R. On the interpretation and interpretability of quantitative structure–activity relationship models // J Comput - Aided Mol Des, 2008. Т.22. №12. С. 857–871. doi: http: //dx.doi.org/10.1007/s10822-008-9240-5.
  5. Fujita T. Winkler D. Understanding the Roles of the “Two QSARs” // J Chem Inf Model, 2016. Т.56. №2. С. 269–274. doi: http://dx.doi.org/10.1021/acs.jcim.5b00229.
  6. Johansson U. et.all. Trade-off between accuracy and interpretability for predictive in silico modeling // Future Med Chem, 2011. Т.3. №6. С. 647–663. doi: http://dx.doi.org/10. 4155/fmc.11.23.
  7. Kuz’min V.E. Hierarchic system of QSAR models (1D – 4D) on the base of simplex representation of molecular structure // J Mol Model, 2005.Т.11. №6. С. 457–467. doi: http://dx.doi.org/https://doi.org/10.1007/s00894-005-0237-x.
  8. Kuz’min V.E., Artemenko A.G., Muratov E.N. Hierarchical QSAR technology based on the Simplex representation of molecular structure // J Comput Aided Mol Des, 2008. Т.22. №6–7. С. 403–421. doi: http://dx.doi.org/10.1007/s10822-008-9179-6.
  9. Polishchuk P.G. et.all. Universal approach for structural interpretation of QSAR/QSPR models // Mol Inf, 2013. Т.32. №9–10. С. 843–853. doi: http://dx.doi.org/10.1002/ minf.201300029.
  10.  Polishchuk PG.et.all. Structural and physico-chemical interpretation (SPCI) of QSAR models and its comparison with matched molecular pair analysis // J Chem Inf Model, 2016. Т.56. №8. С. 1455–1469. doi: http://dx.doi.org/10.1021/acs.jcim.6b00371.
  11. Polishchuk P.G. Interpretation of QSAR models: past, present and future // J Chem Inf Model, 2017. Т.57. №11. С. 2618–2639. doi: http://dx.doi.org/10.1021/acs.jcim. 7b00274.
  12. Tropsha A., Gramatica P., Gombar V.K. The importance of being earnest: validation is the absolute essential for successful application and interpretation of QSPR models // Mol Inf, 2003. Т.22. №1. С. 69–77. doi: http://dx.doi.org/10.1002/qsar.200390007.
  13. Tropsha A.BestpracticesforQSARmodeldevelopment,validation,andexploitation//Mol Inf, 2010. Т.29. №6–7. С. 476—488. doi: http://dx.doi.org/10.1002/minf.201000061.
  14. Адылова Ф.Т., Икрамов А.А. Ансамблевые методы в биоинформатике: опыт их применения в геномике и QSAR моделировании // Проблемы вычислительной и прикладной математики, 2017. №3. С. 87—95.
  15. Polishchuk P.G., Madzhidov T.I., Varnek A. Estimation of the size of drug-like chemical space based on GDB-17 data // J Comput-Aided Mol Des, 2013. Т.27. №8. С. 675—679. doi: http://dx.doi.org/10.1007/s10822-013-9672-4.
  16. Roy K., Ambure P., Aher R.B. How important is to detect systematic error in predictions and understand statistical applicability domain of QSAR models? // Chemom Intell Lab Syst, 2017. Т.162. №8. С. 44—54. doi: http://dx.doi.org/10.1016/j.chemolab.2017. 01.010.
  17. Bhhatarai B., Garg R., Gramatica P. Are mechanistic and statistical QSAR approaches really different? MLR Studies on 158 Cycloalkyl-Pyranones // Mol Inf, 2010. Т.29. №3. С. 511—522. doi: http://dx.doi.org/10.1002/minf.201000011.
  18. Free S.M., Wilson J.W. A mathematical contribution to structure-activity studies // J Med Chem, 1964. Т.7. №4. С. 395—399. doi: http://dx.doi.org/10.1021/jm00334a001.
  19. Wold S., Sj¨ostr¨om M., Eriksson L. PLS-regression: a basic tool of chemometrics // Chemom Intell Lab Syst, 2001. Т.58. №2. С. 109—130. doi: http://dx.doi.org/10.1016/ S0169-7439(01)00155-1.
  20. Stanton D.T. QSAR and QSPR model interpretation using partial least squares (PLS) analysis // Curr Comput-Aided Drug Des, 2012. Т.8. №2. С. 107—127. doi: http://dx. doi.org/10.2174/157340912800492357.
  21. Eriksson L.et.all. Orthogonal PLS (OPLS) modeling for improved analysis and interpretation in Drug design // Mol Inf, 2012. Т.31. №6–7. С. 414—419. doi: http: //dx.doi.org/10.1002/minf.201200158.
  22. Hasegawa K., Funatsu K. Data mining of chemogenomics data using bi-modal PLS methods and chemical interpretation for molecular design // Mol Inf, 2014. Т.33. №11–12. С. 749— 756. doi: http://dx.doi.org/10.1002/minf.201400061.
  23. Breiman L. Classification and regression trees // Wadsworth: Belmont CA, 1984. С. 368.
  24. Breiman L. Random forests // Machine learning , 2001. Т.45. №1. С. 5—32. doi: http: //dx.doi.org/10.1023/A:1010933404324.
  25. Goodfellow I., Bengio Y., Courville A. Deep Learning // The MIT Press London England , 2016. С. 800.
  26. Bengio Y., Courville A., Vincent P. Representation learning: a review and new perspectives // IEEE Trans Pattern Anal Mach Intell, 2013. Т.35. №8. С. 1798—1828. doi: http://dx. doi.org/10.1109/TPAMI.2013.50.
  27. Dahl G. Deep learning approaches to problems in speech recognition. // Computational chemistry and Natural language text processing PhD thesis University of Toronto , 2015. С. 92. doi: http://dx.doi.org/1705.10874.
  28.  Schneider G.et.all.C oping with polypharmacology by computational medicinal chemistry// Chimia , 2014. Т.68. №9. С. 648—653. doi: http://dx.doi.org/10.2533/chimia.2014. 648..
  29. Reutlinger M.et.all. Multi-objective molecular de novo design by adaptive fragment prioritization // Agnew Chem Int Ed Engl , 2014. Т.53. №16. С. 4244—4248. doi: http: //dx.doi.org/10.1002/anie.201310864.
  30. Ma J.et.all. Deep neural nets as a method for quantitative structure–activity relationships // J Chem Inf Model, 2015. Т.55. №2. С. 263—274. doi: http://dx.doi.org/10.1021/ ci500747n.
  31. Erhan D.et.all.Collaborativefilteringonafamilyofbiologicaltargets //JChemInfModel, 2006. Т.46. №2. С. 626—635. doi: http://dx.doi.org/10.1021/ci050367t.
  32. Schneider G.et.all. Virtual screening for bioactive molecules by evolutionary de novo design // Agnew Chem Int Ed Engl, 2000. Т.39. №22. С. 4130—4133. doi: http://dx. doi.org/10.1002/1521-3773.
  33. Wong W.W., Burkowski F.J. A constructive approach for discovering new drug leads: Using a kernel methodology for the inverse-QSAR problem // J Cheminform, 2009. Т.1. №4. doi: http://dx.doi.org/10.1186/1758-2946-1-4..
  34. Koutsoukas A.et.all. Deep learning: investigating deep neural networks hyperparameters and comparison of performance to shallow methods for modeling bioactivity data // J Cheminform, 2017. Т.9. №42. doi: http://dx.doi.org/10.1186/s13321-017-0226-y.
  35. Guha R, Jurs P. Interpreting computational neural network QSAR models: a measure of descriptor importance // J Chem Inf Model, 2005. Т.45. №3. С. 800—806. doi: http: //dx.doi.org/10.1021/ci050022a.
  36. Fu L. Rule learning by searching on adapted nets . // Proceedings of the 9th National conference on Artificial intelligence Anaheim California: AAAI Press, 1991. С. 590—595. doi: http://dx.doi.org/AAAI/1991/AAAI91-092.
  37. Thrun S. Extracting Provably Correct Rules from Artificial Neural Networks // Technical report University of Bonn Germany, 1993. doi: http://dx.doi.org/=10.1.1.2.2110&rep= rep1&type....
  38. Zilke J. Menc´ıa E. Janssen F. DeepRED – rule extraction from deep neural networks // In: Calders T., Ceci M., Malerba D. (eds) Discovery Science., 2016. Т.9956. doi: http: //dx.doi.org/10.1007/978-3-319-46307-0_29.
  39. Barakat N., Bradley A. Rule extraction from support vector machines: A review // Neurocomputing , 2010. Т.74. №1–3. С. 178—190. doi: http://dx.doi.org/10.1016/j. neucom.2010.02.016.
  40. So S., Richards W. Application of neural networks: quantitative structure-activity relationships of the derivatives of 2,4-diamino-5-(substituted-benzyl)pyrimidines as DHFR inhibitors // J Med Chem, 1992. Т.35. №17. С. 3201—3207. doi: http://dx.doi.org/10. 1021/jm00095a016.
  41. Lek S.et.all. Role of some environmental variables in trout abundance models using neural networks // Aquat Living Resour, 1996. Т.9. №1. С. 23—29. doi: http://dx.doi.org/10. 1051/alr:1996004.
  42. Selassie D.C.et.all. Optimization of hydrophobic and hydrophilic substituent interactions of 2,4-diamino-5-(substituted-benzyl)pyrimidines with dihydrofolate reductase // J Med Chem, 1991. Т.34. №1. С. 46—54. doi: http://dx.doi.org/10.1021/jm00105a008.
  43.  Iooss B., Saltelli A. Introduction to sensitivity snalysis // In Handbook of Uncertainty Quantification, Ghanem, R.; Higdon, D.; Owhadi, H., Eds. Springer International Publishing: Cham, 2016. С. 1—20. doi: http://dx.doi.org/10. 10072F978-3-319-11259-6\_31-1.
  44. Адылова Ф.Т., Давронов Р.Р.,Кузиев Б.Н. Методы отбора дескрипторов в моделировании отношения структура-активность (QSAR) // Кимёвий технология назорат ва бошкарув , 2017. №1. С. 82—92.
  45. Strobl C.et.all. Bias in random forest variable importance measures: Illustrations, sources and a solution // BMC Bioinf, 2007. Т.8. №25. doi: http://dx.doi.org/10.1186/ 1471-2105-8-25.
  46. Strobl C.et.all. Conditional variable importance for random forests // BMC Bioinf, 2008. Т.9. №307. doi: http://dx.doi.org/10.1186/1471-2105-9-307.
  47. Aoyama T., Ichikawa H. Neural networks as nonlinear structure-activity relationship analyzers. Useful functions of the partial derivative method in multilayer neural networks // J Chem Inf Comput Sci, 1992. Т.32. №5. С. 492—500. doi: http://dx.doi.org/10. 1021/ci00009a015.
  48. Baskin I.I.et.all. An approach to the interpretation of backpropagation neural network models in QSAR studies // SAR QSAR Environ Res, 2002. Т.13. №1. С. 35—41. doi: http: //dx.doi.org/10.1080/10629360290002073.
  49. Marcou G.et.all. Interpretability of SAR/QSAR models of any complexity by atomic contributions // Mol Inf, 2012. Т.31. №9. С. 639—642. doi: http://dx.doi.org/10.1002/ minf.201100136.
  50. An Y., Sherman W., Dixon S. Kernel-based partial least squares: application to fingerprint based QSAR with model visualization //JChemInfModel,2013.Т.53.№9.С.2312—2321. doi: http://dx.doi.org/10.1021/ci400250c.
  51. Chen H.et.all. Beyond the scope of Free-Wilson analysis: building interpretable QSAR models with machine learning algorithms // J Chem Inf Model, 2013. Т.53. №6. С. 1324— 1336. doi: http://dx.doi.org/10.1021/ci4001376.
  52. St˚alring J.et.all. Localized heuristic inverse quantitative structure activity relationship with bulk descriptors using numerical gradients // J Chem Inf Model, 2013. Т.53. №8. С. 2001— 2017. doi: http://dx.doi.org/10.1021/ci400281y..
  53. Kuz’min V.E.et.all. Interpretation of QSAR models based on random forest method // Mol Inf, 2011. Т.30. №6–7. С. 593—603. doi: http://dx.doi.org/10.1002/minf.201000173.
  54. Riniker S.,Landrum G. Similarity maps - a visualization strategy for molecular fingerprints and machine-learning methods // J Cheminf, 2013. Т.. №43. doi: http://dx.doi.org/ 10.1186/1758-2946-5-43..
  55. Polishchuk P.G. et.all. Universal approach for structural interpretation of QSAR/QSPR models // Mol Inf, 2013. Т.32. №9–10. С. 843—853. doi: http://dx.doi.org/10.1002/ minf.201300029..
  56. P´erez-Garrido A.et.all. Latest QSAR study of adenosine A2B receptor affinity of xanthines and deazaxanthines // Mol Diversity, 2015. Т.19. №4. С. 975—989. doi: http://dx.doi. org/10.1007/s11030-015-9608-0.
  57. Zhang Y.Y.et.all. Integrating in silico and in vitro approaches to predict drug accessibility to the central nervous system // Mol Pharmaceutics , 2016. Т.13. №5. С. 1540—1550. doi: http://dx.doi.org/10.1021/acs.molpharmaceut.6b00031.
  58. Krysko A.A.et.all. Synthesis, biological evaluation and molecular docking studies of 2-piperazin-1-yl-quinazolines as platelet aggregation inhibitors and ligands of integrin Practice and potential for the development of the interpretability of quantitative ... 25 αIIbβ3 // Bioorg Med Chem Lett, 2016. Т.26. №7. С. 1839—1843. doi: http://dx.doi. org/10.1016/j.bmcl.2016.02.011..
  59. Sushko Y.et.all. Prediction driven matched molecular pairs to interpret QSARs and aid the molecular optimization process // J Cheminf, 2014. Т.6. №48. doi: http://dx.doi.org/ 10.1186/s13321-014-0048-0.
  60. Kramer C.et.all. Matched molecular pair analysis: significance and the impact of experimental uncertainty // J Med Chem , 2014. Т.57. №9. С. 3786—3802. doi: http: //dx.doi.org/10.1021/jm500317a.
  61. Tulyaganov N. Pharmacological studies of alkaloids of Peganum Harmala L. quinazoline and quinazolone structure and their derivatives // The dissertation author’s abstract on the scientific degree of Doctor of Chemical Sciences, Moscow, 1981. doi: http://dx.doi. org/10.1016/j.fitote.2017.05.001.
  62. Адылова Ф.Т.et.all. Прогноз ЛД50 активности алкалоидов гармалы обыкновенной хиназолиного, хиназолоного строения и их производных на основе QSAR моделей // Кимёвий технология назорат ва бошқарув , 2015. №5. С. 21—27.
  63. Адылова Ф.Т.et.all. Ошибки в QSAR моделировании // Журнал теоретической и клинической медицины , 2015. №5. С. 140—143.
  64. Адылова Ф.Т.et.all. Сравнительный анализ разработки моделей структура-активность (QSAR) для ряда дитерпеновых алкалоидов: традиционный и новый инструментарий // Тошкент тиббиёт академияси ахборотномаси, 2016. №2. С. 44—48.
  65. Адылова Ф.Т.et.all. Оценка эффективности подхода kNN-QSAR моделирования в хемоинформатике // Mol Inf, 2017. №4. С. 3—6.
  66. cxcalc, version 5.4; Chemaxon: Budapest, Hungary // ,
  67.  Wawer M.,Bajorath J Local structural changes, global data views: graphical substructure– activity relationship trailing // J Med Chem, 2011. Т.54. №8. С. 2944—2951. doi: http: //dx.doi.org/10.1021/jm200026b.
  68. Maggiora G., Bajorath J. Chemical space networks: a powerful new paradigm for the description of chemical space // J Comput-Aided Mol Des, 2014. Т.28. №8. С. 795—802. doi: http://dx.doi.org/10.1007/s10822-014-9760-0.

Список всех публикаций, цитирующих данную статью

Copyright © 2025 UzScite | E-LINE PRESS