Сочетание хемоинформатики и квантов, в бульоне с физикой

МЕНЮ


Главная страница
Поиск
Регистрация на сайте
Помощь проекту
Архив новостей

ТЕМЫ


Новости ИИРазработка ИИВнедрение ИИРабота разума и сознаниеМодель мозгаРобототехника, БПЛАТрансгуманизмОбработка текстаТеория эволюцииДополненная реальностьЖелезоКиберугрозыНаучный мирИТ индустрияРазработка ПОТеория информацииМатематикаЦифровая экономика

Авторизация



RSS


RSS новости


В последнее время, в связи с разработкой хитрых архитектур нейронных сетей, которые предсказывают квантовохимические параметры, мне порой становится очень трудно отделить квантовую химию от хемоинформатики. И сегодняшняя статья - этому прекрасное подтверждение. Но тут еще замешана очень забавная концепция physics-inspired modelling, когда уравнения физики загоняются внутрь модели машинного обучения. Некогда я тут писал о своей статье, в которой мы загоняли уравнения химии внутрь машинного обучения. Правда тогда это термина мы не знали и назвали conjugated modelling (https://vk.com/chemoinformatics?w=wall-107190233_1962).

В общем если кратко, что было в этой статье. Ребята хотели предсказывать возбужденные состояния через машинное обучение. Ну они упростили задачу - их интересуют энергии молекулярных орбиталей Самая простая идея как это делать - натренировать много моделей, каждая предсказывает свою орбиталь (ВЗМО, НСМО, ВЗМО-1 и т.д.), назовем ее 1S-моделью. Не слишком эффективно, хоть и просто. Это в принципе давно использовали. Плохо то, что модель не видит других орбиталей, она б наверное могла за счет индуктивного переноса учиться быстрее и, возможно, лучше. Да и проще в использовании. Чем иметь 10 моделей для 10 орбиталей, интереснее иметь одну. Поэтому появилась вторая - более продвинутая концепция, назвали ее MS-модель: предсказывать сразу все энергии возбуждения одной нейронной сетью (как это сделали в работе тех же авторов ранее https://pubs.acs.org/doi/abs/10.1021/acs.jpclett.0c00527). В чем тут засада: если вы рассматриваете разные конформации одной молекулы, то у вас энергии орбиталей "едут" и может оказаться так, что молекулярная орбиталь, которая раньше была ВЗМО поменялась местами с более низколежащей. Например, это может случиться, если у вас в одной конформации есть сопряжение, а потом оно разрушается. В результате если вы так просто предсказываете энергии орбиталей, то этот эффект сложно отследить модели - возникают сближения, а потом скачки в энергиях возбуждения, от угла меняется природа данной орбитали. Это запутывает модель и потому нехорошо. Поэтому авторы предложили очень элегантный, на мой взгляд подход. Если кратко как работают обычные кванты: вы составляете гамильтониан (матрицу Фока), каждый элемент которого описывает некоторое подобие энергии взаимодействия орбиталей. В ней сидят все одно- и двухчастичные интегралы, а также коэффициенты МО. Далее у этого гамильтониана ищут собственные значения и вектора. Собственные значения - это энергия молекулярной орбитали. Тут возможно, если вы откроете учебники, скажете, что там есть еще матрица перекрывания, но на самом деле определенными трюками от нее избавляются и фокиан оказывается просто матрицей, которую нужно просто диагонализовать, чтоб найти энергии орбиталей (могу потом в комментах прислать, если кому интересно). А пока поверьте на слово. Можно считать матрицу Фока просто матрицей, в которой нас интересуют только собственные значения (они же - энергии МО).

Собственно, что предложили авторы, назовем ее Н-модель: с помощью нейронной сети, которая смотрит на молекулу, предсказывается не энергия отдельных орбиталей, а ВСЕ элементы матрицы Фока. В отличие от обычно используемых методов ее размер фиксирован (сколько орбиталей вас интересует - столько и ставите при тренировке, хотя тут, я полагаю, могут быть сложности на практике). Далее она диагонализуется и получаются энергии орбиталей, которые и считаются предсказанием. Поскольку диагонализация является дифференцируемой операцией (это было для меня новостью, но готов поверить авторам, просто не встречал), то можно полученную нейронку, предсказывающую энергии орбиталей, напрямую проучивать end-to-end. То есть модель будет учиться предсказывать элементы матрицы Фока так, чтоб из нее неким подобием напрямую получались правильные энергии орбиталей. Теперь, если происходит обмен местами орбиталей - это не страшно. В матрице Фока соответствующий диагональный элемент просто уменьшается или увеличивается монотонно.

Дальше была еще одна хитрость - на чем учить Н-модель? Данных квантовой химии по энергиям орбиталей много. Авторы не мучались и брали энергии Кон-шэмовских орбиталей из известного набора OE62, полученного расчетами на PBE0 (https://www.nature.com/articles/s41597-020-0385-y). Натренировали нейронку - получилось неплохо. Только вот в эксперименте не используешь - датасет получен на относительно простом методе и влияние растворителя игнорировалось. Кроме того, эти энергии орбиталей не сооответствуют энергиям молекулярных орбиталей. А именно последние отвечают за энергии возбуждения, присоединения электрона и ионизации молекулы. Но зато есть небольшой (4000 данных) датасет на весьма точных квантах с учетом растворителя. Поэтому они сделали другую модель (delta-модель), которая предсказывала разницу между предсказаниями Н-модели и результатами точных квантов. Таких данных хоть и меньше, но зато там достаточно гладкое поведение - сдвиг орбитали относительно PBE0 к истинной энергии МО относительно слабо и при этом гладко зависит от структуры молекулы. Поэтому они использовали простую MS-модель для предсказания разниц в энергии возбуждения. Тогда истинные энергии орбиталей есть просто сумма предсказаний Н-модели и delta-модели. А эти результаты уже очень неплохо начинают описывать эксперимент! Посмотрите график в приложении: третья строка - это предсказание Н-модели, натренированной на PBE0, а вторая - она же, уточненная delta-моделью.

В общем, эта штука уже ну ооочень похожа на полуэмпирику. До нее остался последний шаг - интегралы считать через нейронки, а не всю матрицу Фока аппроксимировать. Я тут недавно высказал мысль, что скоро нейронки могут потеснить полуэмпирику (https://vk.com/chemoinformatics?w=wall-107190233_3893) и эта статья - явный шаг в этом направлении.


Источник: pubs.rsc.org

Комментарии: