Virxicon: база нуклеотидных последовательностей вирусов

МЕНЮ


Искусственный интеллект
Поиск
Регистрация на сайте
Помощь проекту

ТЕМЫ


Новости ИИРазработка ИИВнедрение ИИРабота разума и сознаниеМодель мозгаРобототехника, БПЛАТрансгуманизмОбработка текстаТеория эволюцииДополненная реальностьЖелезоКиберугрозыНаучный мирИТ индустрияРазработка ПОТеория информацииМатематикаЦифровая экономика

Авторизация



RSS


RSS новости


Проблема того, что искомые данные расположены в разных репозиториях, притом порой с очень отличающейся аннотацией, – извечная для биоинформатиков. С некоторых пор с ней борятся, создавая базы-агрегаторы, собирая отовсюду данные и подводя их под единый стандарт. Одной из таковых является недавно созданная база данных Virxicon, в которой собраны нуклеотидные последовательности вирусов. База находится в открытом доступе в виде веб-браузера и обновляется каждую неделю информацией из NCBI Viral Genome database и GenBank.

Главная страница Virxicon. Источник: http://virxicon.cs.put.poznan.pl/

По мере развития технологий секвенирования, увеличивается и количество имеющихся нуклеотидных последовательностей для различных живых организмов. Проблема в том, что не все последовательности для интересующих таксонов расположены в одной базе и порой бывает сложно и найти, и собрать их вместе, и правильно разнести по таксономии, используя, к тому же, отличающиеся аннотации. В целом, эти действия занимают много ручного внимательного труда и времени. Так и с нуклеотидными последовательностями вирусов. Авторы статьи из журнала Bioinformatics (IF = 5.6), о которой мы рассказываем, создали базу данных для последовательностей ДНК и РНК вирусов. Они пишут, что теперь становится проще получить все данные, находящиеся в открытом доступе, сразу для всей интересующей таксономической единицы, согласно и классификации вирусов по Балтимору, и согласно Международному комитету по таксономии вирусов (ICTV).

Страничка в выдачей результата по некоторому запросу. Источник: http://virxicon.cs.put.poznan.pl/

Конечно, есть и другие базы данных для последовательностей вирусных геномов. Например, это DPVweb для вирусов растений и грибов, GISAID для вируса гриппа и коронавируса, NCBI Viral Genomes для всех имеющихся вирусов. Но, как пишут авторы статьи, там нет возможности сразу взять все имеющиеся данные для определённой таксономической группы. А это для многих научных исследований необходимо. Существуют и базы, которые позволяют проводить некоторый анализ данных, например, The Virus Pathogen Database andAnalysis Resource (ViPR), ViralZone, но сами последовательности они не хранят. А чтобы сравнить возможности всего перечисленного с Virxicon, смотрите таблицу ниже:

Таблица из обсуждаемой статьи.

База находится в открытом доступе в виде веб-браузера и обновляется каждую неделю информацией из NCBI Viral Genome database и GenBank. На 1 января 2021 года в ней находилось 268 504 последовательностей. Выбранные данные можно скачать и далее анализировать самостоятельно. В будущем предполагается добавить возможность пользователям загружать последовательности, проводить поиск по гомологии с использованием BLAST и другие функции.

Ссылка на базу Virxicon: http://virxicon.cs.put.poznan.pl/.Ссылка на статью: https://academic.oup.com/bioinformatics/advance-article/doi/10.1093/bioinformatics/btaa1066/6050704


Источник: m.vk.com

Комментарии: