Сочетание хемоинформатики и квантов, в бульоне с физикой |
||
МЕНЮ Главная страница Поиск Регистрация на сайте Помощь проекту Архив новостей ТЕМЫ Новости ИИ Голосовой помощник Разработка ИИГородские сумасшедшие ИИ в медицине ИИ проекты Искусственные нейросети Искусственный интеллект Слежка за людьми Угроза ИИ ИИ теория Внедрение ИИКомпьютерные науки Машинное обуч. (Ошибки) Машинное обучение Машинный перевод Нейронные сети начинающим Психология ИИ Реализация ИИ Реализация нейросетей Создание беспилотных авто Трезво про ИИ Философия ИИ Big data Работа разума и сознаниеМодель мозгаРобототехника, БПЛАТрансгуманизмОбработка текстаТеория эволюцииДополненная реальностьЖелезоКиберугрозыНаучный мирИТ индустрияРазработка ПОТеория информацииМатематикаЦифровая экономика
Генетические алгоритмы Капсульные нейросети Основы нейронных сетей Распознавание лиц Распознавание образов Распознавание речи Творчество ИИ Техническое зрение Чат-боты Авторизация |
2021-07-09 03:22 В последнее время, в связи с разработкой хитрых архитектур нейронных сетей, которые предсказывают квантовохимические параметры, мне порой становится очень трудно отделить квантовую химию от хемоинформатики. И сегодняшняя статья - этому прекрасное подтверждение. Но тут еще замешана очень забавная концепция physics-inspired modelling, когда уравнения физики загоняются внутрь модели машинного обучения. Некогда я тут писал о своей статье, в которой мы загоняли уравнения химии внутрь машинного обучения. Правда тогда это термина мы не знали и назвали conjugated modelling (https://vk.com/chemoinformatics?w=wall-107190233_1962). В общем если кратко, что было в этой статье. Ребята хотели предсказывать возбужденные состояния через машинное обучение. Ну они упростили задачу - их интересуют энергии молекулярных орбиталей Самая простая идея как это делать - натренировать много моделей, каждая предсказывает свою орбиталь (ВЗМО, НСМО, ВЗМО-1 и т.д.), назовем ее 1S-моделью. Не слишком эффективно, хоть и просто. Это в принципе давно использовали. Плохо то, что модель не видит других орбиталей, она б наверное могла за счет индуктивного переноса учиться быстрее и, возможно, лучше. Да и проще в использовании. Чем иметь 10 моделей для 10 орбиталей, интереснее иметь одну. Поэтому появилась вторая - более продвинутая концепция, назвали ее MS-модель: предсказывать сразу все энергии возбуждения одной нейронной сетью (как это сделали в работе тех же авторов ранее https://pubs.acs.org/doi/abs/10.1021/acs.jpclett.0c00527). В чем тут засада: если вы рассматриваете разные конформации одной молекулы, то у вас энергии орбиталей "едут" и может оказаться так, что молекулярная орбиталь, которая раньше была ВЗМО поменялась местами с более низколежащей. Например, это может случиться, если у вас в одной конформации есть сопряжение, а потом оно разрушается. В результате если вы так просто предсказываете энергии орбиталей, то этот эффект сложно отследить модели - возникают сближения, а потом скачки в энергиях возбуждения, от угла меняется природа данной орбитали. Это запутывает модель и потому нехорошо. Поэтому авторы предложили очень элегантный, на мой взгляд подход. Если кратко как работают обычные кванты: вы составляете гамильтониан (матрицу Фока), каждый элемент которого описывает некоторое подобие энергии взаимодействия орбиталей. В ней сидят все одно- и двухчастичные интегралы, а также коэффициенты МО. Далее у этого гамильтониана ищут собственные значения и вектора. Собственные значения - это энергия молекулярной орбитали. Тут возможно, если вы откроете учебники, скажете, что там есть еще матрица перекрывания, но на самом деле определенными трюками от нее избавляются и фокиан оказывается просто матрицей, которую нужно просто диагонализовать, чтоб найти энергии орбиталей (могу потом в комментах прислать, если кому интересно). А пока поверьте на слово. Можно считать матрицу Фока просто матрицей, в которой нас интересуют только собственные значения (они же - энергии МО). Собственно, что предложили авторы, назовем ее Н-модель: с помощью нейронной сети, которая смотрит на молекулу, предсказывается не энергия отдельных орбиталей, а ВСЕ элементы матрицы Фока. В отличие от обычно используемых методов ее размер фиксирован (сколько орбиталей вас интересует - столько и ставите при тренировке, хотя тут, я полагаю, могут быть сложности на практике). Далее она диагонализуется и получаются энергии орбиталей, которые и считаются предсказанием. Поскольку диагонализация является дифференцируемой операцией (это было для меня новостью, но готов поверить авторам, просто не встречал), то можно полученную нейронку, предсказывающую энергии орбиталей, напрямую проучивать end-to-end. То есть модель будет учиться предсказывать элементы матрицы Фока так, чтоб из нее неким подобием напрямую получались правильные энергии орбиталей. Теперь, если происходит обмен местами орбиталей - это не страшно. В матрице Фока соответствующий диагональный элемент просто уменьшается или увеличивается монотонно. Дальше была еще одна хитрость - на чем учить Н-модель? Данных квантовой химии по энергиям орбиталей много. Авторы не мучались и брали энергии Кон-шэмовских орбиталей из известного набора OE62, полученного расчетами на PBE0 (https://www.nature.com/articles/s41597-020-0385-y). Натренировали нейронку - получилось неплохо. Только вот в эксперименте не используешь - датасет получен на относительно простом методе и влияние растворителя игнорировалось. Кроме того, эти энергии орбиталей не сооответствуют энергиям молекулярных орбиталей. А именно последние отвечают за энергии возбуждения, присоединения электрона и ионизации молекулы. Но зато есть небольшой (4000 данных) датасет на весьма точных квантах с учетом растворителя. Поэтому они сделали другую модель (delta-модель), которая предсказывала разницу между предсказаниями Н-модели и результатами точных квантов. Таких данных хоть и меньше, но зато там достаточно гладкое поведение - сдвиг орбитали относительно PBE0 к истинной энергии МО относительно слабо и при этом гладко зависит от структуры молекулы. Поэтому они использовали простую MS-модель для предсказания разниц в энергии возбуждения. Тогда истинные энергии орбиталей есть просто сумма предсказаний Н-модели и delta-модели. А эти результаты уже очень неплохо начинают описывать эксперимент! Посмотрите график в приложении: третья строка - это предсказание Н-модели, натренированной на PBE0, а вторая - она же, уточненная delta-моделью. В общем, эта штука уже ну ооочень похожа на полуэмпирику. До нее остался последний шаг - интегралы считать через нейронки, а не всю матрицу Фока аппроксимировать. Я тут недавно высказал мысль, что скоро нейронки могут потеснить полуэмпирику (https://vk.com/chemoinformatics?w=wall-107190233_3893) и эта статья - явный шаг в этом направлении. Источник: pubs.rsc.org Комментарии: |
|