Мгновенная расшифровка сырого сигнала MinION при помощи глубокого обучения

МЕНЮ


Искусственный интеллект. Новости
Поиск

ТЕМЫ


Внедрение ИИНовости ИИРобототехника, БПЛАТрансгуманизмЛингвистика, обработка текстаБиология, теория эволюцииВиртулаьная и дополненная реальностьЖелезоКиберугрозыНаучный мирИТ индустрияРазработка ПОТеория информации

RSS


RSS новости

Авторизация



Новостная лента форума ailab.ru

Третья часть нашего рассказа про чтение генома с помощью секвенатора третьего поколения компании Oxford Nanopore уже на подходе, а пока мы доделываем ее, на BioRxiv вышел препринт, в котором описывается алгоритм глубоко обучения для мгновенной трансляции сырого сигнала с MinION в последовательность нуклеотидов.

Секвенирование с помощью нанопоры позволяет получать и анализировать сырой сигнал (кривую изменения электрического тока при протягивании ДНК через пору) мгновенно, пока молекула ДНК еще находится в поре. Бутылочным горлышком этого процесса является бейсколлинг — трансляция сырого сигнала в последовательность ДНК. В стандартном пайплайне обработки данных бейсколлинг состоит из двух этапов: сначала сырой сигнал разбивается на сегменты, затем определенная модель применяется для трансляции сегментов в k-меры.

В статье описывается алгоритм Chiron, совмещающий свёрточную и рекуррентную нейронные сети, а также CTC декодер (Connectionist Temporal Classification decoder), что позволяет транслировать сигнал напрямую, минуя стадию разбиения на сегменты. Для обучения алгоритма понадобилось относительно небольшое количество данных: 4000 ридов бактериальных и вирусных геномов. Тем не менее обученная сеть может использоваться и для расшифровки других геномов, например, млекопитающих. Скорость бейсколлинга в новом алгоритме достигает 2000 нуклеотидов в секунду, и для этого требуется мощность стандартного GPU настольного компьютера.


Источник: www.biorxiv.org