Аффинность антител могут улучшить языковые модели для искусственной эволюции белков

МЕНЮ


Главная страница
Поиск
Регистрация на сайте
Помощь проекту
Архив новостей

ТЕМЫ


Новости ИИРазработка ИИВнедрение ИИРабота разума и сознаниеМодель мозгаРобототехника, БПЛАТрансгуманизмОбработка текстаТеория эволюцииДополненная реальностьЖелезоКиберугрозыНаучный мирИТ индустрияРазработка ПОТеория информацииМатематикаЦифровая экономика

Авторизация



RSS


RSS новости


Языковые модели, обученные на базах данных природных белковых последовательностей, способны предсказывать потенциально выгодные аминокислотные замены. Такой подход позволит перенести моделирование мутагенеза и селекции из пробирки в машинные расчеты и повысить скорость белково-инженерных разработок. Авторы работы проверили свою концепцию на антителах против коронавируса и эболавируса.

Человечество уже научилось «вдохновляться» механизмами эволюции при создании новых белковых молекул. Имитация процесса естественного отбора с помощью повторяющихся циклов мутагенеза, селекции по требуемым свойствам белка и дальнейшей амплификации кодирующего его гена позволяет изменять характеристики уже существующих белков под конкретные задачи. Такую направленную эволюцию можно проводить не только in vivo или in vitro, но и отдать на откуп машинным вычислениям. Методы теоретических расчетов для получения белка с заданными свойствами существуют с 1970-х годов, однако конструирование белковой молекулы с заданными свойствами требует, в отличие от искусственной эволюции, детальных знаний о структуре белка и точных механизмах его активности.

Объединение направленной эволюции с методами машинного обучения позволит сократить объем экспериментальной работы по скринингу и селекции белков, при этом не понадобится подробной информации о механизмах работы целевой конструкции. Один из вариантов предложили авторы статьи, опубликованной в Nature Biotechnology, — применение языковых моделей для искусственной эволюции.

Ученые использовали тот факт, что отдельные мутации могут не только напрямую отбираться либо отбраковываться естественным отбором, но и косвенно изменять такие свойства белка, как стабильность структуры или предрасположенность к дальнейшим эволюционным изменениям. Для выявления типичных аминокислотных паттернов использовали языковые модели, которые обучали на природных последовательностях белков. Обучающая выборка состояла из баз данных, отражающих вариативность аминокислотных последовательностей большого числа природных белков. При таком подходе модель усваивает только общие эволюционные закономерности, в отличие от вариантов контролируемого обучения, где на вход подаются ещё и данные о селективности исследуемых антител.

В общем случае языковой моделью называют распределение вероятностей на множестве последовательностей слов. Иначе говоря, с помощью языковой модели можно оценить вероятность того, что то или иное слово встретится в конкретном контексте. Белковая языковая модель устроена аналогичным образом, но вместо слов или буквосочетаний в ней рассматриваются сочетания аминокислот. Ранее уже было показано, что языковые модели способны предсказывать направление эволюции белков, однако для этого требовалась информация о предыдущей эволюционной траектории.

Здесь же авторы с помощью языковой модели предсказали эволюционно-правдоподобные мутации существующих антител, которые увеличили бы их аффинность к антигену. Обученной на базе данных природных белков модели подавали на вход аминокислотную последовательность антитела, после чего отбирали не более 20 наиболее вероятных (по оценке модели) вариантов для дальнейшего лабораторного скрининга. Всего таким образом была проведена искусственная эволюция семи человеческих иммуноглобулинов (IgG), связывающих антигены вирусов SARS-CoV-1/2, COVID-19, эболавируса и вируса гриппа А.

Используемые языковые модели включали такие варианты, как ESM-1b (вариант языковой модели на базе рекуррентных нейросетей для работы с аминокислотными последовательностями) и ESM-1v. Последняя представляет собой языковую модель для предсказания эффектов аминокислотных замен, способную распределять обрабатываемые данные в том числе по новым, не встречавшимся в обучающей выборке классам (в машинном обучении такие методы носят название zero-shot learning).

Исследователи обучили эти модели на базах данных UniRef50 и UniRef90, содержащих аминокислотные последовательности множества известных белков (так, UniRef90 содержит около 98 млн последовательностей). Затем для каждого из семи исследуемых антител были рассчитаны варианты вероятных аминокислотных замен. Всего было проведено два этапа эволюции, каждый из которых подразумевал единичную замену аминокислоты. Во второй этап при этом отбирали те варианты из первого, анализ аффинности которых показал такое же или улучшенное связывание относительно исходного антитела.

По результатам двух этапов такой эволюции авторы добились улучшения аффинности антител. Для зрелых (прошедших процесс соматической гипермутации и, в отдельных случаях, искусственной эволюции, которые повышают их аффинность к антигену) антител было показано in vitro увеличение связывающей способности до 7-кратного, а для незрелых — до 160-кратного по сравнению с исходным вариантом. Также авторы протестировали нейтрализующую активность улучшенных антител на псевдовирусах. Для этого анализа были выбраны четыре из семи исходных вариантов, и для всех четырех искусственная эволюция усилила эффективность нейтрализации. Так, концентрация полумаксимального ингибирования (IC50) возросла в полтора раза для антитела, специфичного к вирусу лихорадки Эбола, и в 32 раза для наиболее эффективного варианта антитела к SARS-CoV-2.

Кроме того, для специфичных к антигенам эболавируса и SARS-CoV-2 антител также достигли улучшения их термостабильности.

По мнению авторов, полученные результаты могут не только расширить возможности белковой инженерии и найти применение в других прикладных задачах, но и оказаться полезными для более глубокого изучения естественных эволюционных механизмов.

Коронавирус не может бесконечно увеличивать свою приспособленность


Источник: pcr.news

Комментарии: