Virxicon: база нуклеотидных последовательностей вирусов |
||
МЕНЮ Главная страница Поиск Регистрация на сайте Помощь проекту Архив новостей ТЕМЫ Новости ИИ Голосовой помощник Разработка ИИГородские сумасшедшие ИИ в медицине ИИ проекты Искусственные нейросети Искусственный интеллект Слежка за людьми Угроза ИИ ИИ теория Внедрение ИИКомпьютерные науки Машинное обуч. (Ошибки) Машинное обучение Машинный перевод Нейронные сети начинающим Психология ИИ Реализация ИИ Реализация нейросетей Создание беспилотных авто Трезво про ИИ Философия ИИ Big data Работа разума и сознаниеМодель мозгаРобототехника, БПЛАТрансгуманизмОбработка текстаТеория эволюцииДополненная реальностьЖелезоКиберугрозыНаучный мирИТ индустрияРазработка ПОТеория информацииМатематикаЦифровая экономика
Генетические алгоритмы Капсульные нейросети Основы нейронных сетей Распознавание лиц Распознавание образов Распознавание речи Творчество ИИ Техническое зрение Чат-боты Авторизация |
2021-01-10 01:28 Проблема того, что искомые данные расположены в разных репозиториях, притом порой с очень отличающейся аннотацией, – извечная для биоинформатиков. С некоторых пор с ней борятся, создавая базы-агрегаторы, собирая отовсюду данные и подводя их под единый стандарт. Одной из таковых является недавно созданная база данных Virxicon, в которой собраны нуклеотидные последовательности вирусов. База находится в открытом доступе в виде веб-браузера и обновляется каждую неделю информацией из NCBI Viral Genome database и GenBank. По мере развития технологий секвенирования, увеличивается и количество имеющихся нуклеотидных последовательностей для различных живых организмов. Проблема в том, что не все последовательности для интересующих таксонов расположены в одной базе и порой бывает сложно и найти, и собрать их вместе, и правильно разнести по таксономии, используя, к тому же, отличающиеся аннотации. В целом, эти действия занимают много ручного внимательного труда и времени. Так и с нуклеотидными последовательностями вирусов. Авторы статьи из журнала Bioinformatics (IF = 5.6), о которой мы рассказываем, создали базу данных для последовательностей ДНК и РНК вирусов. Они пишут, что теперь становится проще получить все данные, находящиеся в открытом доступе, сразу для всей интересующей таксономической единицы, согласно и классификации вирусов по Балтимору, и согласно Международному комитету по таксономии вирусов (ICTV). Конечно, есть и другие базы данных для последовательностей вирусных геномов. Например, это DPVweb для вирусов растений и грибов, GISAID для вируса гриппа и коронавируса, NCBI Viral Genomes для всех имеющихся вирусов. Но, как пишут авторы статьи, там нет возможности сразу взять все имеющиеся данные для определённой таксономической группы. А это для многих научных исследований необходимо. Существуют и базы, которые позволяют проводить некоторый анализ данных, например, The Virus Pathogen Database andAnalysis Resource (ViPR), ViralZone, но сами последовательности они не хранят. А чтобы сравнить возможности всего перечисленного с Virxicon, смотрите таблицу ниже: База находится в открытом доступе в виде веб-браузера и обновляется каждую неделю информацией из NCBI Viral Genome database и GenBank. На 1 января 2021 года в ней находилось 268 504 последовательностей. Выбранные данные можно скачать и далее анализировать самостоятельно. В будущем предполагается добавить возможность пользователям загружать последовательности, проводить поиск по гомологии с использованием BLAST и другие функции. Ссылка на базу Virxicon: http://virxicon.cs.put.poznan.pl/.Ссылка на статью: https://academic.oup.com/bioinformatics/advance-article/doi/10.1093/bioinformatics/btaa1066/6050704 Источник: m.vk.com Комментарии: |
|