Нейросеть прольёт свет на «тёмную материю» транскриптома

МЕНЮ


Искусственный интеллект
Поиск
Регистрация на сайте
Помощь проекту

ТЕМЫ


Новости ИИРазработка ИИВнедрение ИИРабота разума и сознаниеМодель мозгаРобототехника, БПЛАТрансгуманизмОбработка текстаТеория эволюцииДополненная реальностьЖелезоКиберугрозыНаучный мирИТ индустрияРазработка ПОТеория информацииМатематикаЦифровая экономика

Авторизация



RSS


RSS новости


Исследовательская группа детской больницы Филадельфии (CHOP) во главе с И Сином — директором Центра вычислительной и геномной медицины на базе CHOP, опубликовала в Nature Methods (Zijun Zhang et.al, 2019) отчёт по разработанной ими системе DARTS (Deep-learning Augmented RNA-seq analysis of Transcript Splicing) — системе расширенного анализа сплайсинга транскриптов на основе данных РНК-секвенирования. DARTS использует предсказания, полученные методами deep-learning, что позволяет привлечь информацию из открытых баз с данными РНК-секвенирования и по-новому взглянуть на явление альтернативного сплайсинга.

«Принципиальная новизна DARTS в том, что она обеспечивает связь между большим объемом уже собранной информации из открытого доступа и данными конкретного исследования» — объясняет Син — «DARTS открывает пользователям возможность трансформации больших объемов публичных данных РНК-секвенирования в базу знаний регуляции сплайсинга, представленную глубокой нейронной сетью. Её использование может повысить эффективность проводимых экспериментов и даже привести к ряду научных открытий. Располагая всего 20 или 30 миллионами RNA-seq ридов вы можете делать обоснованные предположения и выводы о вещах, которых раньше даже не могли увидеть.»

И Син на протяжении многих лет занимается изучением альтернативного сплайсинга — процесса, в ходе которого информация с ДНК конкретного гена по-разному организуется с образованием различных матричных РНК и, соответственно, различных белковых продуктов. Каждый ген, в среднем, образует около 10 вариантов продуктов, а иногда их число может достигает 38 тысяч. Некоторые из этих вариантов могут приводить к заболеваниям, а также положительно или отрицательно влиять на их течение.

В настоящее время массовое параллельное секвенирование РНК является стандартной технологией, применяемой в исследованиях альтернативного сплайсинга. Однако точное измерение требует большой глубины прочтения: более 100 миллионов ридов, по общепринятому мнению, необходимо для адекватной оценки альтернативного сплайсинга, что недоступно большинству исследователей. Кроме того, многие гены, представляющие интерес для медицины, имеют невысокий уровень экспрессии, поэтому даже глубокое РНК-секвенирование не даёт достаточного покрытия этих генов, что делает изучение их альтернативного сплайсинга фактически невозможным.

В данном исследовании впервые в полном объёме используются общедоступные данные РНК-секвенирования консорциума ENCODE, запущенного Национальным институтом исследований генома человека (США) и других источников. На этих данных DARTS обучает нейросеть для предсказания изменений в вариантах сплайсинга (рис.1). Модель включает в себя уровни матричной РНК 1 500 РНК-связывающих белков и около 3 000 свойств последовательностей.

Чтобы сделать модель доступной для широкого круга исследователей, предсказания нейросети были скомбинированы статистическим методом Байесовской проверки гипотез с реальными данными РНК-секвенирования. Эта информация может быть использована в лабораториях для характеристики альтернативного сплайсинга в различных условиях.

Рис. 1. а, Общая схема работы системы DARTS b, Схема свойств нейронной сети DARTS c, Обзор процесса обучения нейросети и количество значимых случаев альтернативного сплайсинга на данных ENCODE the outer and middle circles) d, Сравнение глубокой нейросети DARTS c другими методами.Картинка из обсуждаемой статьи

Для проверки предсказательной способности системы DARTS исследователи протестировали её на клеточных линиях рака лёгких и простаты. Эти клеточные линии традиционно используются в качестве моделей для изучения эпителиально-мезенхимного перехода — процесса, происходящего в эмбриональном развитии и при метастазировании опухолей. Опираясь на предсказания нейронной сети, DARTS выявил изменения в паттернах сплайсинга множества генов, которые не выявлялись традиционными методами ввиду низкого уровня их экспрессии. Для валидации полученных предсказаний исследователи провели ряд дополнительных экспериментов.

«DARTS предлагает любопытный механизм, который может быть впоследствии адаптирован и для других целей,» — поясняет руководитель группы — «Например, могут быть разработаны версии программы для определенных типов тканей человека.» Предложенная методика тканеспецифичных предсказаний имеет большой потенциал для применения в диагностике редких заболеваний с использованием метода биопсии тканей.

DARTS способна предоставить исследователям возможность установить функцию недостаточно изученных генов, которые, несмотря на низкий уровень экспрессии, оказывают серьёзное влияние на развитие того или иного заболевания. Исследователи верят, что их система способна «приоткрыть окно в тёмную материю транскриптома».

Ссылка на статью: https://www.nature.com/articles/s41592-019-0351-9

Ссылка на репозиторий: https://github.com/Xinglab/DARTS


Источник: vk.com

Комментарии: