Нейросеть прольёт свет на «тёмную материю» транскриптома |
||
МЕНЮ Искусственный интеллект Поиск Регистрация на сайте Помощь проекту ТЕМЫ Новости ИИ Искусственный интеллект Разработка ИИГолосовой помощник Городские сумасшедшие ИИ в медицине ИИ проекты Искусственные нейросети Слежка за людьми Угроза ИИ ИИ теория Внедрение ИИКомпьютерные науки Машинное обуч. (Ошибки) Машинное обучение Машинный перевод Реализация ИИ Реализация нейросетей Создание беспилотных авто Трезво про ИИ Философия ИИ Big data Работа разума и сознаниеМодель мозгаРобототехника, БПЛАТрансгуманизмОбработка текстаТеория эволюцииДополненная реальностьЖелезоКиберугрозыНаучный мирИТ индустрияРазработка ПОТеория информацииМатематикаЦифровая экономика
Генетические алгоритмы Капсульные нейросети Основы нейронных сетей Распознавание лиц Распознавание образов Распознавание речи Техническое зрение Чат-боты Авторизация |
2019-04-11 17:03 Исследовательская группа детской больницы Филадельфии (CHOP) во главе с И Сином — директором Центра вычислительной и геномной медицины на базе CHOP, опубликовала в Nature Methods (Zijun Zhang et.al, 2019) отчёт по разработанной ими системе DARTS (Deep-learning Augmented RNA-seq analysis of Transcript Splicing) — системе расширенного анализа сплайсинга транскриптов на основе данных РНК-секвенирования. DARTS использует предсказания, полученные методами deep-learning, что позволяет привлечь информацию из открытых баз с данными РНК-секвенирования и по-новому взглянуть на явление альтернативного сплайсинга. «Принципиальная новизна DARTS в том, что она обеспечивает связь между большим объемом уже собранной информации из открытого доступа и данными конкретного исследования» — объясняет Син — «DARTS открывает пользователям возможность трансформации больших объемов публичных данных РНК-секвенирования в базу знаний регуляции сплайсинга, представленную глубокой нейронной сетью. Её использование может повысить эффективность проводимых экспериментов и даже привести к ряду научных открытий. Располагая всего 20 или 30 миллионами RNA-seq ридов вы можете делать обоснованные предположения и выводы о вещах, которых раньше даже не могли увидеть.» И Син на протяжении многих лет занимается изучением альтернативного сплайсинга — процесса, в ходе которого информация с ДНК конкретного гена по-разному организуется с образованием различных матричных РНК и, соответственно, различных белковых продуктов. Каждый ген, в среднем, образует около 10 вариантов продуктов, а иногда их число может достигает 38 тысяч. Некоторые из этих вариантов могут приводить к заболеваниям, а также положительно или отрицательно влиять на их течение. В настоящее время массовое параллельное секвенирование РНК является стандартной технологией, применяемой в исследованиях альтернативного сплайсинга. Однако точное измерение требует большой глубины прочтения: более 100 миллионов ридов, по общепринятому мнению, необходимо для адекватной оценки альтернативного сплайсинга, что недоступно большинству исследователей. Кроме того, многие гены, представляющие интерес для медицины, имеют невысокий уровень экспрессии, поэтому даже глубокое РНК-секвенирование не даёт достаточного покрытия этих генов, что делает изучение их альтернативного сплайсинга фактически невозможным. В данном исследовании впервые в полном объёме используются общедоступные данные РНК-секвенирования консорциума ENCODE, запущенного Национальным институтом исследований генома человека (США) и других источников. На этих данных DARTS обучает нейросеть для предсказания изменений в вариантах сплайсинга (рис.1). Модель включает в себя уровни матричной РНК 1 500 РНК-связывающих белков и около 3 000 свойств последовательностей. Чтобы сделать модель доступной для широкого круга исследователей, предсказания нейросети были скомбинированы статистическим методом Байесовской проверки гипотез с реальными данными РНК-секвенирования. Эта информация может быть использована в лабораториях для характеристики альтернативного сплайсинга в различных условиях. Для проверки предсказательной способности системы DARTS исследователи протестировали её на клеточных линиях рака лёгких и простаты. Эти клеточные линии традиционно используются в качестве моделей для изучения эпителиально-мезенхимного перехода — процесса, происходящего в эмбриональном развитии и при метастазировании опухолей. Опираясь на предсказания нейронной сети, DARTS выявил изменения в паттернах сплайсинга множества генов, которые не выявлялись традиционными методами ввиду низкого уровня их экспрессии. Для валидации полученных предсказаний исследователи провели ряд дополнительных экспериментов. «DARTS предлагает любопытный механизм, который может быть впоследствии адаптирован и для других целей,» — поясняет руководитель группы — «Например, могут быть разработаны версии программы для определенных типов тканей человека.» Предложенная методика тканеспецифичных предсказаний имеет большой потенциал для применения в диагностике редких заболеваний с использованием метода биопсии тканей. DARTS способна предоставить исследователям возможность установить функцию недостаточно изученных генов, которые, несмотря на низкий уровень экспрессии, оказывают серьёзное влияние на развитие того или иного заболевания. Исследователи верят, что их система способна «приоткрыть окно в тёмную материю транскриптома». Ссылка на статью: https://www.nature.com/articles/s41592-019-0351-9 Ссылка на репозиторий: https://github.com/Xinglab/DARTS Источник: vk.com Комментарии: |
|