Ученые СФУ сумели в десятки раз увеличить скорость анализа генома

2018-07-26 15:06

Разрабатывать алгоритм начали в 2015 году

Красноярские ученые создали алгоритм быстрого поиска сходных последовательностей, который позволяет до 10 раз и более повысить скорость анализа структур геномов, сообщил ТАСС один из авторов работы, доктор физико-математических наук, профессор Института космических и информационных технологий Сибирского федерального университета (СФУ) Сергей Царев.

Открытые базы данных по генетическим структурам позволяют исследователям в режиме онлайн-запросов искать близкие генетические структуры или их части для анализа геномов, однако время выполнения такого запроса иногда исчисляется сутками. С аналогичной проблемой ученые сталкиваются и при сборке полного генома организма, в частности, геномов хвойных растений, особенность которых - большая доля повторов. Такой процесс занимает недели работы крупных вычислительных кластеров. Математики в настоящее время работают над созданием быстрых алгоритмов поиска совпадающих подпоследовательностей в больших массивах подобных текстовых данных.

"Наш метод называется "быстрый поиск с обобщенной шкалой нониуса". Идея напоминает работу штангенциркуля, который имеет штангу с основной шкалой и нониус - вспомогательную шкалу для отсчета долей делений. Этот принцип позволяет резко повысить скорости работы - в 10 раз, иногда больше. Кроме того, наш алгоритм может найти сходные участки ДНК там, где другие алгоритмы могут их пропустить", - рассказал Царев.

По его словам, быстрые алгоритмы поиска в текстах - область, применяемая чуть ли не везде в современном мире. Например, искать информацию в Google получается за считанные секунды, потому что там, кроме быстрых компьютеров, имеются весьма изощренные алгоритмы быстрого поиска нужной информации в накопленных данных. Другой пример - поиск сходных текстов системами типа "антиплагиат", поиск ошибок в больших текстах и так далее.

Разработка алгоритма, по словам Царева, началась в 2015 году - тогда совместно с красноярским биофизиком, профессором Михаилом Садовским решено было разработать новый алгоритм быстрого поиска, учитывая специфику геномики. Первых результатов ученым удалось достичь уже в 2016 году и продемонстрировать работу алгоритма на геноме человека и геноме одной из разновидностей дрозофилы. Сравнивая полученные результаты с имеющимися алгоритмами поиска в геномной информации, в том числе со самым старым из них BLAST, оказалось, что алгоритм красноярских ученых значительно превосходит их по скорости поиска данных.

В дальнейшем исследователи намерены встроить свой алгоритм в имеющиеся алгоритмы поиска в геномных базах данных, ускорив их работу. "Также планируем опробовать эту идею в смежных областях - поиск сходных текстов в системах типа "антиплагиат", ускорение поиска в интернете - тут, конечно, своя область, но и там явно возможен прогресс", - отметил Царев.

Телеграм: t.me/ainewsline

Источник: tass.ru



		Ученые СФУ сумели в десятки раз увеличить скорость анализа генома
МЕНЮ Главная страница Поиск Регистрация на сайте Помощь проекту Архив новостей ТЕМЫ Новости ИИ Голосовой помощник Городские сумасшедшие ИИ в медицине ИИ проекты Искусственные нейросети Искусственный интеллект Слежка за людьми Угроза ИИ Разработка ИИ Атаки на ИИ ИИ теория Компьютерные науки Машинное обуч. (Ошибки) Машинное обучение Машинный перевод Нейронные сети начинающим Психология ИИ Реализация ИИ Реализация нейросетей Создание беспилотных авто Трезво про ИИ Философия ИИ Внедрение ИИ Big data Генетические алгоритмы Капсульные нейросети Основы нейронных сетей Промпты. Генеративные запросы Распознавание лиц Распознавание образов Распознавание речи Творчество ИИ Техническое зрение Чат-боты Работа разума и сознание Изучение сна Изучение сознания Нейроинтерфейс Психология Работа мозга Работа памяти Работа разума Модель мозга Модель мозга Робототехника, БПЛА Беспилотные автомобили БПЛА Робототехника Трансгуманизм Трансгуманизм Обработка текста Анализ социальных сетей Компьютерная лингвистика Лингвистика Поисковые алгоритмы Теория эволюции Головной мозг Нейронные сети Поведение животных Теория эволюции Дополненная реальность Виртулаьная реальность Дополненная реальность Железо Интернет вещей Квантовый компьютер Нейронные процессоры облачные вычисления Суперкомпьютеры Киберугрозы Кибербезопасность Научный мир Методы исследования Наука и образование Семинары ИТ индустрия ИТ-гиганты Новости ит Разработка ПО Разработка ПО Теория алгоритмов Теория информации Кластеризация Математика Актуальная математика Статистика Теория вероятности Теория информации Теория хаоса Цифровая экономика Технология блокчейн Цифровая экономика Авторизация RSS RSS новости		2018-07-26 15:06 поисковые алгоритмы, Теория эволюции Разрабатывать алгоритм начали в 2015 году Красноярские ученые создали алгоритм быстрого поиска сходных последовательностей, который позволяет до 10 раз и более повысить скорость анализа структур геномов, сообщил ТАСС один из авторов работы, доктор физико-математических наук, профессор Института космических и информационных технологий Сибирского федерального университета (СФУ) Сергей Царев. Открытые базы данных по генетическим структурам позволяют исследователям в режиме онлайн-запросов искать близкие генетические структуры или их части для анализа геномов, однако время выполнения такого запроса иногда исчисляется сутками. С аналогичной проблемой ученые сталкиваются и при сборке полного генома организма, в частности, геномов хвойных растений, особенность которых - большая доля повторов. Такой процесс занимает недели работы крупных вычислительных кластеров. Математики в настоящее время работают над созданием быстрых алгоритмов поиска совпадающих подпоследовательностей в больших массивах подобных текстовых данных. "Наш метод называется "быстрый поиск с обобщенной шкалой нониуса". Идея напоминает работу штангенциркуля, который имеет штангу с основной шкалой и нониус - вспомогательную шкалу для отсчета долей делений. Этот принцип позволяет резко повысить скорости работы - в 10 раз, иногда больше. Кроме того, наш алгоритм может найти сходные участки ДНК там, где другие алгоритмы могут их пропустить", - рассказал Царев. По его словам, быстрые алгоритмы поиска в текстах - область, применяемая чуть ли не везде в современном мире. Например, искать информацию в Google получается за считанные секунды, потому что там, кроме быстрых компьютеров, имеются весьма изощренные алгоритмы быстрого поиска нужной информации в накопленных данных. Другой пример - поиск сходных текстов системами типа "антиплагиат", поиск ошибок в больших текстах и так далее. Разработка алгоритма, по словам Царева, началась в 2015 году - тогда совместно с красноярским биофизиком, профессором Михаилом Садовским решено было разработать новый алгоритм быстрого поиска, учитывая специфику геномики. Первых результатов ученым удалось достичь уже в 2016 году и продемонстрировать работу алгоритма на геноме человека и геноме одной из разновидностей дрозофилы. Сравнивая полученные результаты с имеющимися алгоритмами поиска в геномной информации, в том числе со самым старым из них BLAST, оказалось, что алгоритм красноярских ученых значительно превосходит их по скорости поиска данных. В дальнейшем исследователи намерены встроить свой алгоритм в имеющиеся алгоритмы поиска в геномных базах данных, ускорив их работу. "Также планируем опробовать эту идею в смежных областях - поиск сходных текстов в системах типа "антиплагиат", ускорение поиска в интернете - тут, конечно, своя область, но и там явно возможен прогресс", - отметил Царев. Телеграм: t.me/ainewsline Источник: tass.ru Комментарии:

Ученые СФУ сумели в десятки раз увеличить скорость анализа генома

Комментарии: