Программа глубокого обучения Google для определения трёхмерной структуры белков может изменить биологию, говорят исследователи

МЕНЮ


Искусственный интеллект
Поиск
Регистрация на сайте
Помощь проекту

ТЕМЫ


Новости ИИРазработка ИИВнедрение ИИРабота разума и сознаниеМодель мозгаРобототехника, БПЛАТрансгуманизмОбработка текстаТеория эволюцииДополненная реальностьЖелезоКиберугрозыНаучный мирИТ индустрияРазработка ПОТеория информацииМатематикаЦифровая экономика

Авторизация



RSS


RSS новости


Сеть искусственного интеллекта (ИИ), разработанная Google AI, ответвлением DeepMind, сделала гигантский скачок в решении одной из величайших задач биологии – определении трёхмерной структуры белка по его аминокислотной последовательности.

Программа, разработанная DeepMind, получила название AlphaFold и превзошла около 100 других команд в проводимом раз в два года конкурсе по прогнозированию структуры белка – CASP (сокращение от Critical Assessment of Structure Prediction). Результаты были объявлены 30 ноября в начале конференции, проводимой в этом году онлайн, на которой подводятся итоги конкурса.

Программа глубокого обучения Google для определения трёхмерной структуры белков может изменить биологию, говорят исследователи

«Это большое дело», – говорит Джон Моулт (John Moult), вычислительный биолог из Университета Мэриленда в Колледж-Парке, который стал соучредителем CASP в 1994 году с целью улучшения вычислительных методов для точного предсказания структур белков. «В каком-то смысле проблема решена».

Возможность точно предсказать структуру белков по их аминокислотной последовательности станет огромным толчком для наук о жизни и медицины. Это значительно ускорит достижение понимания строительных кирпичиков клеток и позволит быстрее и эффективнее создавать лекарства.

AlphaFold попала в верхние строки итоговой таблицы на CASP в 2018 году, первом году участия DeepMind от Лондона. Но в этом году сеть глубокого обучения этого подразделения была на голову выше других команд и, по словам учёных, работала крайне ошеломляюще, что предвещает революцию в биологии.

«Это меняет правила игры», – говорит Андрей Люпас (Andrei Lupas), эволюционный биолог из Института биологии развития им. Макса Планка в Тюбингене, Германия, который оценивал работу различных команд в рамках CASP. AlphaFold уже помог ему найти структуру белка, которая волновала его лабораторию в течение десяти лет, и он ожидает, что это изменит то, как он работает, и какие вопросы решает. «Это изменит медицину. Это изменит исследования. Это изменит биоинженерию. Это всё изменит», – добавляет Люпас.

В некоторых случаях предсказания структуры AlphaFold были неотличимы от тех, которые были определены с использованием экспериментальных методов «золотого стандарта», таких как рентгеновская кристаллография и, в последние годы, криоэлектронная микроскопия (крио-ЭМ). AlphaFold, возможно, пока не избавит от необходимости в этих трудоёмких и дорогих методах, говорят учёные, но ИИ позволит изучать живые существа по-новому.

Проблема структуры

Белки – это строительные кирпичики живых существ, ответственные за большую часть того, что происходит внутри клеток. Как работает белок и что он делает, определяется его трёхмерной структурой. «Структура есть функция» – аксиома молекулярной биологии. Белки склонны формировать свою структуру без посторонней помощи, руководствуясь только законами физики.

На протяжении десятилетий лабораторные эксперименты были основным способом получения хороших белковых структур. Первые полные структуры белков были определены, начиная с 1950-х годов, с использованием техники, в которой рентгеновские лучи направляются на кристаллизованные белки, а дифрагированный свет переводится в координаты атомов белка. Рентгеновская кристаллография дала львиную долю белковых структур. Но за последнее десятилетие крио-ЭМ стала излюбленным инструментом многих лабораторий, которые специализируются на структурной биологии.

Учёные давно задавались вопросом, как составные части белка – цепочка различных аминокислот – отображают множество изгибов и складок в его окончательной структуре. По словам исследователей, ранние попытки использовать компьютеры для предсказания белковых структур в 1980-х и 1990-х годах не увенчались успехом. Горделивые заявления опубликованных методов имели тенденцию исчезать, когда другие учёные применяли их к другим белкам.

Моулт (Moult) запустил CASP, чтобы усилить эти попытки. Конкурс ставит перед командами задачу предсказать структуры белков, которые были определены с помощью экспериментальных методов, но структуры которых не были опубликованы. Моулт считает, что эксперимент – он не называет его соревнованием – значительно улучшил ситуацию, тестируя преувеличенные заявления. «Вы действительно понимаете, что выглядит многообещающим, что работает, а от чего следует отказаться», – говорит он.

Выступление DeepMind на выставке CASP13 в 2018 году поразило многих учёных в этой области, которая долгое время была неприступной крепостью для небольших академических групп. Но их подход в целом был похож на подходы других команд, применяющих ИИ, говорит Джинбо Зю (Jinbo Xu), вычислительный биолог из Университета Чикаго, штат Иллинойс.

Первая итерация AlphaFold применяла метод искусственного интеллекта, известный как глубокое обучение, к структурным и генетическим данным для прогнозирования расстояния между парами аминокислот в белке. На втором этапе, не использующем ИИ, AlphaFold использует эту информацию для создания «консенсусной» модели того, как должен выглядеть белок, говорит Джон Джампер (John Jumper) из DeepMind, возглавляющий проект.

Команда попыталась развить этот подход, но в конце концов упёрлась в стену. Затем, по словам Джампера, компания изменила курс и разработала сеть искусственного интеллекта, которая включала дополнительную информацию о физических и геометрических ограничениях, определяющих, как сворачивается белок. Они также поставили перед ним более сложную задачу: вместо того, чтобы предсказывать взаимоотношения между аминокислотами, сеть предсказывает окончательную структуру для последовательности целевого белка. «Это намного более сложная система», – говорит Джампер.

Поразительная точность

CASP проходит в течение нескольких месяцев. Целевые белки или части белков, называемые доменами – всего около 100 – выпускаются на регулярной основе, и у команд есть несколько недель, чтобы представить свои прогнозы структур. Затем группа независимых учёных оценивает прогнозы, используя показатели, которые определяют, насколько предсказанный белок похож на экспериментально определённую структуру. Те, кто оценивают структуры, не знают, кто делает прогноз.

«Предсказания AlphaFold появились под названием «группа 427», но поразительная точность многих из его записей выделяла их», – говорит Люпас. «Я догадался, что это AlphaFold. Большинство людей решило так же», – говорит он.

Некоторые прогнозы были лучше других, но почти две трети были сопоставимы по качеству с экспериментальными структурами. В некоторых случаях, говорит Моулт, было неясно, было ли несоответствие между предсказаниями AlphaFold и экспериментальным результатом ошибкой предсказания или артефактом эксперимента.

Прогнозы AlphaFold плохо соответствовали экспериментальным структурам, определённым с помощью метода, называемого спектроскопией ядерного магнитного резонанса, но это могло быть связано с тем, как необработанные данные преобразуются в модель, говорит Моулт. Сети также не очень хорошо удаётся моделировать отдельные структуры в белковых комплексах, или группах, где взаимодействие с другими белками искажает их структуру.

В целом, команды предсказали структуры более точно в этом году, по сравнению с предыдущим CASP, но большая часть прогресса может быть отнесена к AlphaFold, говорит Моулт. По целевым белкам, которые считаются умеренно сложными, лучшие результаты других команд обычно набирали 75 баллов по 100-балльной шкале точности прогнозов, тогда как AlphaFold набирал около 90 баллов по тем же показателям, упомянул Моулт.

Моулт также намекнул, что ИИ оказывает большое влияние на эту область науки, заявив, что около половины команд упомянули «глубокое обучение» в аннотациях к своим проектам. Большинство из них были от академических команд, но Microsoft и китайская технологическая компания Tencent также вошли в CASP14.

Мохаммед Аль-Кураиши (Mohammed AlQuraishi), вычислительный биолог из Колумбийского университета в Нью-Йорке и участник CASP, хочет вникнуть в детали результатов участия AlphaFold в конкурсе и узнать больше о том, как работает система. «Возможно, но маловероятно, – говорит он, – что более лёгкий, чем обычно, сбор целевых белков повлиял на результат». Аль-Кураиши уверен в том, что AlphaFold изменит мир. «Я думаю, будет справедливо сказать, что это будет революционно для области предсказания структуры белка. Я подозреваю, что многие уйдут с поля, поскольку основная проблема, возможно, решена», – говорит он. «Это прорыв первого порядка, безусловно, один из самых значительных научных результатов за время моей жизни».

Более быстрые структуры

Прогноз AlphaFold помог определить структуру бактериального белка, которую лаборатория Люпаса пыталась взломать в течение многих лет. Команда Люпаса ранее собирала необработанные данные дифракции рентгеновских лучей, но преобразование паттернов, подобных тестам Роршаха, в структуру требует некоторой информации о форме белка. Уловки для получения этой информации, как и других инструментов прогнозирования, не увенчались успехом. «Модель из группы 427 дала нам нашу структуру за полчаса, после того, как мы потратили целых десять лет, пробуя всё возможное», – говорит Люпас.

Демис Хассабис (Demis Hassabis), соучредитель и генеральный директор DeepMind, говорит, что компания планирует сделать AlphaFold полезной, чтобы её смогли применять другие учёные. (Ранее он опубликовал достаточно подробностей о первой версии AlphaFold, чтобы другие учёные могли воспроизвести этот подход). Работа AlphaFold по прогнозированию структуры, которая включает оценку достоверности предсказания различных участков белка, может занять несколько дней. «Мы только начинаем понимать, чего бы хотели биологи», – добавляет Хассабис, который рассматривает открытие лекарств и дизайн белков как потенциальные приложения.

В начале 2020 года компания опубликовала прогнозы структуры небольшого количества белков SARS-CoV-2, которые ещё не были определены экспериментально. По словам Стивена Брохона (Stephen Brohawn), молекулярного нейробиолога из Калифорнийского университета в Беркли, предсказания DeepMind для белка под названием Orf3a оказались очень похожими на предсказания, полученные позже с помощью крио-ЭМ. «То, что им удалось сделать, очень впечатляет», – добавляет он.

Мировое значение

AlphaFold вряд ли закроет лаборатории, такие как у Брохона, которые используют экспериментальные методы для определения структуры белков. Но это может означать, что менее качественные и более простые для сбора экспериментальные данные – это всё, что нужно для создания хорошей структуры. Некоторые приложения, такие как эволюционный анализ белков, будут процветать, потому что цунами доступных геномных данных теперь может быть надёжно переведено в структуры. «Это даст возможность новому поколению молекулярных биологов задавать более сложные вопросы», – говорит Люпас. «Это потребует больше размышлений и меньше пипетирования».

«Я начала думать, что это проблема не будет решена при моей жизни», – говорит Джанет Торнтон (Janet Thornton), структурный биолог из Европейской лаборатории молекулярной биологии (EMBL) Европейского института биоинформатики в Хинкстоне, Великобритания, и бывший эксперт CASP. Она надеется, что этот подход поможет пролить свет на функцию тысяч непонятных белков в геноме человека и разобраться в вариациях генов, вызывающих болезни, которые варьируются у разных людей.

AlphaFold также знаменует собой поворотный момент для DeepMind. Компания наиболее известна тем, что использует ИИ для покорения таких игр, как Го, но её долгосрочная цель – разработать программы, способные достичь широкого, подобного человеческому, интеллекта. По словам Хассабиса, решение грандиозных научных задач, таких как предсказание структуры белков, является одной из наиболее важных задач, которые может решить их ИИ. «Я считаю, что это самое важное, что мы сделали с точки зрения мирового значения».

Перевод: Марина Марченко.

Редактор: Рами Масамрех.


Источник: zen.yandex.ru

Комментарии: