Американские исследователи из Мичигана создали нейросеть, которая анализирует ДНК человека и интерпретирует эти данные в набор фактов.

МЕНЮ


Искусственный интеллект
Поиск
Регистрация на сайте
Помощь проекту

ТЕМЫ


Новости ИИРазработка ИИВнедрение ИИРабота разума и сознаниеМодель мозгаРобототехника, БПЛАТрансгуманизмОбработка текстаТеория эволюцииДополненная реальностьЖелезоКиберугрозыНаучный мирИТ индустрияРазработка ПОТеория информацииМатематикаЦифровая экономика

Авторизация



RSS


RSS новости


Американские исследователи из Мичигана создали нейросеть, которая анализирует ДНК человека и интерпретирует эти данные в набор фактов. Обучали её на внушительной выборке, учёные воспользовались генетической информацией 500 тысяч жителей Великобритании.

В статье, опубликованной в журнале Genesis, авторы алгоритма сообщают, что новая нейросеть способна предсказать рост человека с точностью до пары сантиметров. Немного хуже точность прогнозов у плотности костей. Эта нейросеть способна даже определить уровень образования — правда, точно она это делает лишь в случае крайних отклонений.

Теперь исследователи намерены расширить массив данных для новой нейросети и обучить её прогнозированию генетических заболеваний, рака и диабета. Статья о новом алгоритме доступна по адресу http://www.genetics.org/content/210/2/477, а бонусом — наука глазами журналистов (новость посвящена той же самой нейросети).

Мы строим геномные предикторы для наследуемых, но чрезвычайно сложных количественных признаков человека (рост, плотность пяточной кости и уровень образования), используя современные методы в статистике высоких измерений (т. е. машинное обучение). Построенные предикторы объясняют, соответственно, ?40, 20 и 9% общей дисперсии для трех признаков в данных, не используемых для обучения. Например, прогнозируемые высоты коррелируют ?0.65 с фактической высотой; фактические высоты большинства людей в проверочных выборках находятся в пределах нескольких сантиметров от прогноза. Доля дисперсии, объясненная для высоты, сопоставима с оцененной общей наследуемостью SNP из комплексного анализа признаков (GCTA) всего генома и, по-видимому, близка к ее асимптотическому значению (т. е. E., поскольку размер выборки доходит до бесконечности), предполагая, что мы захватили большую часть наследуемости для SNP. Таким образом, наши результаты закрывают разрыв между предсказанием R-квадрата и общей наследуемостью SNP. SN 20k активированные SNP в нашем предсказателе высоты показывают генетическую архитектуру человеческого роста, по крайней мере, для распространенных вариантов. Наш основной набор данных-когорта британского биобанка, состоящая из почти 500 тыс. индивидуальных генотипов с несколькими фенотипами. Мы также используем другие наборы данных и SNP, найденные в более ранних геномных исследованиях ассоциации (GWAS) для вне выборки проверки наших результатов.


Источник: www.genetics.org

Комментарии: