Практика и потенциал развития интерпретируемости моделей количественного отношения «структура-активность» (QSAR)
- № 5(17) 2018
Страницы:
7
–
26
Язык: русский
Аннотация
Достоинство модели QSAR состоит в понимании механизма изучаемого действия, поэтому проблема интерпретируемости модели приобретает особую актуальность.Сегодня есть тысячи молекулярных дескрипторов, доступных для построения моделей QSAR, но дать физико-химическую интерпретацию для многих из них часто невозможно. До недавнего времени применялась схема интерпретации «модельдескриптор-структура», зависящая от набора дескрипторов и методов машинного обучения, что затрудняло интерпретацию моделей, построенных на новейших методах машинного обучения. Выходом стала новая парадигма «модель-структура», обеспечивающая понимание смысла любой модели QSAR. В статье анализируются плюсы и минусы подходов к интерпретации, и в вычислительном эксперименте обосновывается эффективность нового универсального подходак интерпретаци и моделей QSAR.
The advantage of the QSAR model is the revealing of the action mechanism being studied, so the problem of the interpretability of the model is very essential. Today there are thousands of molecular descriptors available for constructing QSAR models, but it is often impossible to give a physic-chemical interpretation to many of them. Until recently, the «model-descriptor-structure»interpretation scheme was used, depending on the set of descriptors and machine learning methods, which made it difficult to interpret models based on the advanced methods of machine learning. The solution of this problem was thenew»model-structure»paradigm, which provides understanding of the meaning of any QSAR model. The article analyzes the pros and cons of approaches to interpretation, and in the computational running, the effectiveness of a new universal approach to the interpretation of QSAR models is justified.
The advantage of the QSAR model is the revealing of the action mechanism being studied, so the problem of the interpretability of the model is very essential. Today there are thousands of molecular descriptors available for constructing QSAR models, but it is often impossible to give a physic-chemical interpretation to many of them. Until recently, the «model-descriptor-structure»interpretation scheme was used, depending on the set of descriptors and machine learning methods, which made it difficult to interpret models based on the advanced methods of machine learning. The solution of this problem was thenew»model-structure»paradigm, which provides understanding of the meaning of any QSAR model. The article analyzes the pros and cons of approaches to interpretation, and in the computational running, the effectiveness of a new universal approach to the interpretation of QSAR models is justified.