Сочетание хемоинформатики и квантов, в бульоне с физикой

2021-07-09 03:22

В последнее время, в связи с разработкой хитрых архитектур нейронных сетей, которые предсказывают квантовохимические параметры, мне порой становится очень трудно отделить квантовую химию от хемоинформатики. И сегодняшняя статья - этому прекрасное подтверждение. Но тут еще замешана очень забавная концепция physics-inspired modelling, когда уравнения физики загоняются внутрь модели машинного обучения. Некогда я тут писал о своей статье, в которой мы загоняли уравнения химии внутрь машинного обучения. Правда тогда это термина мы не знали и назвали conjugated modelling (https://vk.com/chemoinformatics?w=wall-107190233_1962).

В общем если кратко, что было в этой статье. Ребята хотели предсказывать возбужденные состояния через машинное обучение. Ну они упростили задачу - их интересуют энергии молекулярных орбиталей Самая простая идея как это делать - натренировать много моделей, каждая предсказывает свою орбиталь (ВЗМО, НСМО, ВЗМО-1 и т.д.), назовем ее 1S-моделью. Не слишком эффективно, хоть и просто. Это в принципе давно использовали. Плохо то, что модель не видит других орбиталей, она б наверное могла за счет индуктивного переноса учиться быстрее и, возможно, лучше. Да и проще в использовании. Чем иметь 10 моделей для 10 орбиталей, интереснее иметь одну. Поэтому появилась вторая - более продвинутая концепция, назвали ее MS-модель: предсказывать сразу все энергии возбуждения одной нейронной сетью (как это сделали в работе тех же авторов ранее https://pubs.acs.org/doi/abs/10.1021/acs.jpclett.0c00527). В чем тут засада: если вы рассматриваете разные конформации одной молекулы, то у вас энергии орбиталей "едут" и может оказаться так, что молекулярная орбиталь, которая раньше была ВЗМО поменялась местами с более низколежащей. Например, это может случиться, если у вас в одной конформации есть сопряжение, а потом оно разрушается. В результате если вы так просто предсказываете энергии орбиталей, то этот эффект сложно отследить модели - возникают сближения, а потом скачки в энергиях возбуждения, от угла меняется природа данной орбитали. Это запутывает модель и потому нехорошо. Поэтому авторы предложили очень элегантный, на мой взгляд подход. Если кратко как работают обычные кванты: вы составляете гамильтониан (матрицу Фока), каждый элемент которого описывает некоторое подобие энергии взаимодействия орбиталей. В ней сидят все одно- и двухчастичные интегралы, а также коэффициенты МО. Далее у этого гамильтониана ищут собственные значения и вектора. Собственные значения - это энергия молекулярной орбитали. Тут возможно, если вы откроете учебники, скажете, что там есть еще матрица перекрывания, но на самом деле определенными трюками от нее избавляются и фокиан оказывается просто матрицей, которую нужно просто диагонализовать, чтоб найти энергии орбиталей (могу потом в комментах прислать, если кому интересно). А пока поверьте на слово. Можно считать матрицу Фока просто матрицей, в которой нас интересуют только собственные значения (они же - энергии МО).

Собственно, что предложили авторы, назовем ее Н-модель: с помощью нейронной сети, которая смотрит на молекулу, предсказывается не энергия отдельных орбиталей, а ВСЕ элементы матрицы Фока. В отличие от обычно используемых методов ее размер фиксирован (сколько орбиталей вас интересует - столько и ставите при тренировке, хотя тут, я полагаю, могут быть сложности на практике). Далее она диагонализуется и получаются энергии орбиталей, которые и считаются предсказанием. Поскольку диагонализация является дифференцируемой операцией (это было для меня новостью, но готов поверить авторам, просто не встречал), то можно полученную нейронку, предсказывающую энергии орбиталей, напрямую проучивать end-to-end. То есть модель будет учиться предсказывать элементы матрицы Фока так, чтоб из нее неким подобием напрямую получались правильные энергии орбиталей. Теперь, если происходит обмен местами орбиталей - это не страшно. В матрице Фока соответствующий диагональный элемент просто уменьшается или увеличивается монотонно.

Дальше была еще одна хитрость - на чем учить Н-модель? Данных квантовой химии по энергиям орбиталей много. Авторы не мучались и брали энергии Кон-шэмовских орбиталей из известного набора OE62, полученного расчетами на PBE0 (https://www.nature.com/articles/s41597-020-0385-y). Натренировали нейронку - получилось неплохо. Только вот в эксперименте не используешь - датасет получен на относительно простом методе и влияние растворителя игнорировалось. Кроме того, эти энергии орбиталей не сооответствуют энергиям молекулярных орбиталей. А именно последние отвечают за энергии возбуждения, присоединения электрона и ионизации молекулы. Но зато есть небольшой (4000 данных) датасет на весьма точных квантах с учетом растворителя. Поэтому они сделали другую модель (delta-модель), которая предсказывала разницу между предсказаниями Н-модели и результатами точных квантов. Таких данных хоть и меньше, но зато там достаточно гладкое поведение - сдвиг орбитали относительно PBE0 к истинной энергии МО относительно слабо и при этом гладко зависит от структуры молекулы. Поэтому они использовали простую MS-модель для предсказания разниц в энергии возбуждения. Тогда истинные энергии орбиталей есть просто сумма предсказаний Н-модели и delta-модели. А эти результаты уже очень неплохо начинают описывать эксперимент! Посмотрите график в приложении: третья строка - это предсказание Н-модели, натренированной на PBE0, а вторая - она же, уточненная delta-моделью.

В общем, эта штука уже ну ооочень похожа на полуэмпирику. До нее остался последний шаг - интегралы считать через нейронки, а не всю матрицу Фока аппроксимировать. Я тут недавно высказал мысль, что скоро нейронки могут потеснить полуэмпирику (https://vk.com/chemoinformatics?w=wall-107190233_3893) и эта статья - явный шаг в этом направлении.

Источник: pubs.rsc.org



		Сочетание хемоинформатики и квантов, в бульоне с физикой
МЕНЮ Главная страница Поиск Регистрация на сайте Помощь проекту Архив новостей ТЕМЫ Новости ИИ Голосовой помощник Городские сумасшедшие ИИ в медицине ИИ проекты Искусственные нейросети Искусственный интеллект Слежка за людьми Угроза ИИ Разработка ИИ ИИ теория Компьютерные науки Машинное обуч. (Ошибки) Машинное обучение Машинный перевод Нейронные сети начинающим Психология ИИ Реализация ИИ Реализация нейросетей Создание беспилотных авто Трезво про ИИ Философия ИИ Внедрение ИИ Big data Генетические алгоритмы Капсульные нейросети Основы нейронных сетей Распознавание лиц Распознавание образов Распознавание речи Творчество ИИ Техническое зрение Чат-боты Работа разума и сознание Изучение сна Изучение сознания Нейроинтерфейс Психология Работа мозга Работа памяти Работа разума Модель мозга Модель мозга Робототехника, БПЛА Беспилотные автомобили БПЛА Робототехника Трансгуманизм Трансгуманизм Обработка текста Анализ социальных сетей Компьютерная лингвистика Лингвистика Поисковые алгоритмы Теория эволюции Головной мозг Нейронные сети Поведение животных Теория эволюции Дополненная реальность Виртулаьная реальность Дополненная реальность Железо Интернет вещей Квантовый компьютер Нейронные процессоры облачные вычисления Суперкомпьютеры Киберугрозы Кибербезопасность Научный мир Методы исследования Наука и образование Семинары ИТ индустрия ИТ-гиганты Новости ит Разработка ПО Разработка ПО Теория алгоритмов Теория информации Кластеризация Математика Актуальная математика Статистика Теория вероятности Теория информации Теория хаоса Цифровая экономика Технология блокчейн Цифровая экономика Авторизация RSS RSS новости		2021-07-09 03:22 машинное обучение python В последнее время, в связи с разработкой хитрых архитектур нейронных сетей, которые предсказывают квантовохимические параметры, мне порой становится очень трудно отделить квантовую химию от хемоинформатики. И сегодняшняя статья - этому прекрасное подтверждение. Но тут еще замешана очень забавная концепция physics-inspired modelling, когда уравнения физики загоняются внутрь модели машинного обучения. Некогда я тут писал о своей статье, в которой мы загоняли уравнения химии внутрь машинного обучения. Правда тогда это термина мы не знали и назвали conjugated modelling (https://vk.com/chemoinformatics?w=wall-107190233_1962). В общем если кратко, что было в этой статье. Ребята хотели предсказывать возбужденные состояния через машинное обучение. Ну они упростили задачу - их интересуют энергии молекулярных орбиталей Самая простая идея как это делать - натренировать много моделей, каждая предсказывает свою орбиталь (ВЗМО, НСМО, ВЗМО-1 и т.д.), назовем ее 1S-моделью. Не слишком эффективно, хоть и просто. Это в принципе давно использовали. Плохо то, что модель не видит других орбиталей, она б наверное могла за счет индуктивного переноса учиться быстрее и, возможно, лучше. Да и проще в использовании. Чем иметь 10 моделей для 10 орбиталей, интереснее иметь одну. Поэтому появилась вторая - более продвинутая концепция, назвали ее MS-модель: предсказывать сразу все энергии возбуждения одной нейронной сетью (как это сделали в работе тех же авторов ранее https://pubs.acs.org/doi/abs/10.1021/acs.jpclett.0c00527). В чем тут засада: если вы рассматриваете разные конформации одной молекулы, то у вас энергии орбиталей "едут" и может оказаться так, что молекулярная орбиталь, которая раньше была ВЗМО поменялась местами с более низколежащей. Например, это может случиться, если у вас в одной конформации есть сопряжение, а потом оно разрушается. В результате если вы так просто предсказываете энергии орбиталей, то этот эффект сложно отследить модели - возникают сближения, а потом скачки в энергиях возбуждения, от угла меняется природа данной орбитали. Это запутывает модель и потому нехорошо. Поэтому авторы предложили очень элегантный, на мой взгляд подход. Если кратко как работают обычные кванты: вы составляете гамильтониан (матрицу Фока), каждый элемент которого описывает некоторое подобие энергии взаимодействия орбиталей. В ней сидят все одно- и двухчастичные интегралы, а также коэффициенты МО. Далее у этого гамильтониана ищут собственные значения и вектора. Собственные значения - это энергия молекулярной орбитали. Тут возможно, если вы откроете учебники, скажете, что там есть еще матрица перекрывания, но на самом деле определенными трюками от нее избавляются и фокиан оказывается просто матрицей, которую нужно просто диагонализовать, чтоб найти энергии орбиталей (могу потом в комментах прислать, если кому интересно). А пока поверьте на слово. Можно считать матрицу Фока просто матрицей, в которой нас интересуют только собственные значения (они же - энергии МО). Собственно, что предложили авторы, назовем ее Н-модель: с помощью нейронной сети, которая смотрит на молекулу, предсказывается не энергия отдельных орбиталей, а ВСЕ элементы матрицы Фока. В отличие от обычно используемых методов ее размер фиксирован (сколько орбиталей вас интересует - столько и ставите при тренировке, хотя тут, я полагаю, могут быть сложности на практике). Далее она диагонализуется и получаются энергии орбиталей, которые и считаются предсказанием. Поскольку диагонализация является дифференцируемой операцией (это было для меня новостью, но готов поверить авторам, просто не встречал), то можно полученную нейронку, предсказывающую энергии орбиталей, напрямую проучивать end-to-end. То есть модель будет учиться предсказывать элементы матрицы Фока так, чтоб из нее неким подобием напрямую получались правильные энергии орбиталей. Теперь, если происходит обмен местами орбиталей - это не страшно. В матрице Фока соответствующий диагональный элемент просто уменьшается или увеличивается монотонно. Дальше была еще одна хитрость - на чем учить Н-модель? Данных квантовой химии по энергиям орбиталей много. Авторы не мучались и брали энергии Кон-шэмовских орбиталей из известного набора OE62, полученного расчетами на PBE0 (https://www.nature.com/articles/s41597-020-0385-y). Натренировали нейронку - получилось неплохо. Только вот в эксперименте не используешь - датасет получен на относительно простом методе и влияние растворителя игнорировалось. Кроме того, эти энергии орбиталей не сооответствуют энергиям молекулярных орбиталей. А именно последние отвечают за энергии возбуждения, присоединения электрона и ионизации молекулы. Но зато есть небольшой (4000 данных) датасет на весьма точных квантах с учетом растворителя. Поэтому они сделали другую модель (delta-модель), которая предсказывала разницу между предсказаниями Н-модели и результатами точных квантов. Таких данных хоть и меньше, но зато там достаточно гладкое поведение - сдвиг орбитали относительно PBE0 к истинной энергии МО относительно слабо и при этом гладко зависит от структуры молекулы. Поэтому они использовали простую MS-модель для предсказания разниц в энергии возбуждения. Тогда истинные энергии орбиталей есть просто сумма предсказаний Н-модели и delta-модели. А эти результаты уже очень неплохо начинают описывать эксперимент! Посмотрите график в приложении: третья строка - это предсказание Н-модели, натренированной на PBE0, а вторая - она же, уточненная delta-моделью. В общем, эта штука уже ну ооочень похожа на полуэмпирику. До нее остался последний шаг - интегралы считать через нейронки, а не всю матрицу Фока аппроксимировать. Я тут недавно высказал мысль, что скоро нейронки могут потеснить полуэмпирику (https://vk.com/chemoinformatics?w=wall-107190233_3893) и эта статья - явный шаг в этом направлении. Источник: pubs.rsc.org Комментарии:

Сочетание хемоинформатики и квантов, в бульоне с физикой

Комментарии: