Активность регуляторных элементов в геноме человека научились точно предсказывать по их нуклеотидной последовательности |
||
МЕНЮ Главная страница Поиск Регистрация на сайте Помощь проекту Архив новостей ТЕМЫ Новости ИИ Голосовой помощник Разработка ИИГородские сумасшедшие ИИ в медицине ИИ проекты Искусственные нейросети Искусственный интеллект Слежка за людьми Угроза ИИ ИИ теория Внедрение ИИКомпьютерные науки Машинное обуч. (Ошибки) Машинное обучение Машинный перевод Нейронные сети начинающим Психология ИИ Реализация ИИ Реализация нейросетей Создание беспилотных авто Трезво про ИИ Философия ИИ Big data Работа разума и сознаниеМодель мозгаРобототехника, БПЛАТрансгуманизмОбработка текстаТеория эволюцииДополненная реальностьЖелезоКиберугрозыНаучный мирИТ индустрияРазработка ПОТеория информацииМатематикаЦифровая экономика
Генетические алгоритмы Капсульные нейросети Основы нейронных сетей Распознавание лиц Распознавание образов Распознавание речи Творчество ИИ Техническое зрение Чат-боты Авторизация |
2025-01-16 15:52 Используя большие экспериментальные данные и машинное обучение, исследователи из США при участии российских биоинформатиков изучили активность десятков тысяч регуляторных элементов в геноме человека и разработали нейросетевую модель для предсказания свойств регуляторных элементов по его последовательности. В геноме человека содержатся миллионы цис-регуляторных элементов (CRE), находящихся на той же хромосоме, что и регулируемые ими гены. Активность CRE специфична для разных клеточных типов и определяет развитие и здоровое состояние организма, а мутации в них связаны с различными патологиями, включая онкологические и аутоиммунные заболевания. В частности, полногеномные исследования ассоциаций (GWAS) выявляют множество генетических вариантов, связанных с болезнями не в кодирующих, а в регуляторных участках генома. Одна из нерешенных задач в этой области: понять, как нуклеотидная последовательность регуляторных элементов определяет их активность и специфичную работу в конкретном типе клеток. В частности, это позволило бы предсказывать функциональные эффекты нуклеотидных замен в CRE и интерпретировать индивидуальный геном конкретного пациента. Над задачей широкомасштабного изучения регуляторной активности для различных некодирующих элементов генома работала команда исследователей из университетов Вашингтона, Калифорнийского и других американских и европейских университетов при участии российских биоинформатиков из Института общей генетики РАН и Института белка РАН (команда Ивана Кулаковского). Итоговая статья по результатам исследования опубликована в журнале Nature. В экспериментальной части работы, которую проводили молекулярные биологи в США, поставили эксперимент на основе параллельных репортеров (massively parallel reporter assay, MPRA). Эта технология позволяет одновременно и единообразно установить регуляторную активность десятков и сотен тысяч последовательностей. Традиционный подход MPRA предполагает, что изучаемые последовательности работают в составе плазмиды, доставленной в клетку. В данной работе ученые использовали усовершенствованный вариант MPRA с лентивирусным вектором, с помощью которого изучаемые последовательности встраивали непосредственно в клеточный геном. Каждый кандидатный CRE помечали баркодом — коротким фрагментом нуклеотидов, — а затем измеряли транскрипционную активность конкретной последовательности CRE в клетке. Это делали путем секвенирования РНК, по результатам которого ученые оценивали возможную роль CRE как промотора (непосредственно управляющего началом транскрипции гена) или энхансера («усилителя» транскрипции). В том числе авторы смотрели, имеет ли значение ориентация встроенной последовательности (его 5’ и 3’ концов) по отношению к целевому гену. Таким образом они протестировали более 680 тысяч последовательностей на трех часто используемых и характерно отличающихся клеточных линиях: модельных гепатоцитах (клеточная линия HepG2), лимфобластах (K562) и индуцированных плюрипотентных стволовых клетках (iPSC; клеточная линия WTC11). По результатам экспериментов авторы увидели, какие регуляторные последовательности активны в той или иной клеточной культуре, и выявили признаки, которые определяют их клеточно-специфическую активность. В частности, они показали, что промоторы сильнее зависят от ориентации нуклеотидной последовательности, чем энхансеры, но последние обладают большей клеточной специфичностью. По полученным данным ученые собрали каталог, включающий тысячи CRE. Такие большие данные открыли возможность создать компьютерную модель, которая предсказывала бы регуляторную активность CRE в том или другом типе клеток по его нуклеотидной последовательности. Сначала исследователи из СЩА разработали и протестировали три своих модели и опубликовали предварительные результаты в виде препринта. Далее произошло несколько событий, подчеркивающих важность международного сотрудничества между учеными. Подробности PCR. NEWS рассказывает Дмитрий Пензар (Институт общей генетики РАН, Институт белка РАН, Институт трансляционной медицины Медицинского университета им. Н.И.Пирогова), один из авторов статьи: — В тот момент мы представили новую нейросетевую архитектуру для работы с короткими регуляторными участками генома — LegNet. Эта нейросеть одержала уверенную победу в международном конкурсе по предсказанию активности промоторных последовательностей у дрожжей. Конечно было чрезвычайно интересно, можно ли применить ту же архитектуру для работы с геномом человека, что приблизило бы нас на шаг к возможному практическому применению наших компьютерных разработок. И в этот момент удачно появился препринт американских коллег, где были представлены и подходящие экспериментальные данные и сравнительные результаты трех ранее представленных методов. Мы адаптировали архитектуру, уверенно превзошли описанные в препринте решения и оспорили несколько высказанных авторами предположений. Мы написали короткий критический разбор в социальных сетях и ожидали, как максимум, некоторой дискуссии. Однако неожиданно нам напрямую написал первый автор статьи, Викрам Агарвал (Vikram Agarwal), и, что было вдвойне неожиданно, предложил интегрировать нашу модель и представленный анализ в статью. В итоге мы провели дополнительный вычислительный анализ, творчески использовали наши базы данных по регуляторным вариантам генома человека, аккуратно оформили наш код и модель. В целом, получилось очень продуктивное и приятное сотрудничество, и, на наш взгляд, мы смогли радикально улучшить статью. Так научная дискуссия, начатая в социальной сети, привела к продуктивному партнерству и интересным результатам. Созданная российскими биоинформатиками модель (MPRALegNet, построенная на исходной разработке LegNet) оказалась не просто наилучшей, но работает с гораздо меньшим числом параметров, чем альтернативные модели. Это делает ее более доступной, ведь эту модель можно обучить и использовать даже на персональном ноутбуке со стандартной для нынешних времен видеокартой, предназначенной для компьютерных игр. Можно малыми силами быстро обучить ее на самых различных данных о регуляторных последовательностях взаимодействия. В свою очередь, это снижает стоимость и сложность использования модели для дальнейших биоинформатических исследований. И позволяет даже коллективам со сравнительно небольшим финансированием заниматься разработками, связанными с оптимизацией генной терапии и интерпретацией данных об индивидуальном геноме в персонализированной медицине. При реконструкции предковых геномов различных видов были открыты новые мобильные элементы Источник: pcr.news Комментарии: |
|