Мгновенная расшифровка сырого сигнала MinION при помощи глубокого обучения

МЕНЮ


Новости ИИ
Поиск

ТЕМЫ


Внедрение ИИНовости ИИРобототехника, БПЛАТрансгуманизмЛингвистика, обработка текстаБиология, теория эволюцииВиртулаьная и дополненная реальностьЖелезоКиберугрозыНаучный мирИТ индустрияРазработка ПОТеория информации

АРХИВ


Октябрь 2017
Сентябрь 2017
Август 2017
Июль 2017
Июнь 2017
Май 2017
Апрель 2017
Март 2017
Февраль 2017
Январь 2017
Декабрь 2016
Ноябрь 2016
Октябрь 2016
Сентябрь 2016
Август 2016
Июль 2016
Июнь 2016
Май 2016
Апрель 2016
Март 2016
Февраль 2016
Январь 2016
0000

RSS


RSS новости
Ураган харви в США

Новостная лента форума ailab.ru

Третья часть нашего рассказа про чтение генома с помощью секвенатора третьего поколения компании Oxford Nanopore уже на подходе, а пока мы доделываем ее, на BioRxiv вышел препринт, в котором описывается алгоритм глубоко обучения для мгновенной трансляции сырого сигнала с MinION в последовательность нуклеотидов.

Секвенирование с помощью нанопоры позволяет получать и анализировать сырой сигнал (кривую изменения электрического тока при протягивании ДНК через пору) мгновенно, пока молекула ДНК еще находится в поре. Бутылочным горлышком этого процесса является бейсколлинг — трансляция сырого сигнала в последовательность ДНК. В стандартном пайплайне обработки данных бейсколлинг состоит из двух этапов: сначала сырой сигнал разбивается на сегменты, затем определенная модель применяется для трансляции сегментов в k-меры.

В статье описывается алгоритм Chiron, совмещающий свёрточную и рекуррентную нейронные сети, а также CTC декодер (Connectionist Temporal Classification decoder), что позволяет транслировать сигнал напрямую, минуя стадию разбиения на сегменты. Для обучения алгоритма понадобилось относительно небольшое количество данных: 4000 ридов бактериальных и вирусных геномов. Тем не менее обученная сеть может использоваться и для расшифровки других геномов, например, млекопитающих. Скорость бейсколлинга в новом алгоритме достигает 2000 нуклеотидов в секунду, и для этого требуется мощность стандартного GPU настольного компьютера.


Источник: www.biorxiv.org