Секвенируй меня полностью

2019-05-19 06:00

Сначала короткий ликбез для тех, кто ещё не знает или уже забыл, что означают некоторые слова из трёх букв: ДНК и ген. Строение и форма организмов, в том числе человека, определяются белками, структура которых зашифрована в дезоксирибонуклеиновой кислоте (ДНК). Она представляет собой спираль из двух переплетённых цепей. Каждая цепь состоит из четырёх видов звеньев-нуклеотидов, обозначаемых буквами: А, Т, Г, Ц. Последовательность нуклеотидов определяет свойства кодируемого белка. Участок ДНК, кодирующий структуру одного вида белка, называется «ген», а совокупность наследственного материала организма — «геном».

Одним из величайших прорывов XX века стал вывод, что ДНК можно прочитать, словно это текст, и понять индивидуальные особенности организма. А если прочитать ДНК разных организмов, можно понять, насколько близки этносы, как люди расселялись по планете и чем обусловлены наследственные заболевания.
Над первой в истории расшифровкой человеческого генома учёные бились больше десяти лет. В 2003-м эта задача была решена. Дальше процесс пошёл быстрее благодаря совершенствованию технологии секвенирования (от англ. sequence — последовательность), то есть определения порядка нуклеотидов ДНК.

Очень много данных

Современная геномика — область, где данных чрезвычайно много. Особенно сейчас, когда учёные пытаются сделать медицину персонализированной, основанной на информации о клеточном строении каждого отдельного человека. Лаборатории по всему миру ежегодно собирают терабайты и петабайты информации, а данные биобанков удваиваются каждые семь месяцев.

— Если в одном и том же участке гена у одного человека стоит буква А, а у другого Ц, это патогенная мутация или норма? Единственная возможность ответить на этот вопрос — исследовать как можно больше людей, посмотреть частоту данной мутации в популяции, выяснить, больны или здоровы её носители. Некоторые мутации встречаются часто, и их легко идентифицировать, но есть и очень редкие — одна на миллион. Именно поэтому в мире сейчас активно накапливают генетическую информацию, — рассказывает Андрей Афанасьев, гендиректор компании iBinom, старший научный сотрудник лаборатории функционального анализа генома МФТИ, на конференции «Яндекса» «Data & Science: биоинформатика».

В 2008 году учёные из Азии, Европы, Африки, США и Латинской Америки включились в беспрецедентное по масштабам исследование «1 000 геномов». Целью проекта было создание максимально подробной карты генетических вариаций человека. Исследователи планировали секвенировать геномы по крайней мере тысячи анонимных участников — представителей разных этнических групп. Проект завершился в 2015 году с перевыполнением плана: секвенировали 2,5 тыс. геномов представителей 26 популяций из 5 регионов мира; описали свыше 88 млн генетических вариаций.

Наша страна в проект «1 000 геномов» не попала и теперь навёрстывает упущенное. В 2015 году сотрудники Центра геномной биоинформатики им. Ф. Г. Добржанского Санкт-Петербургского госуниверситета запустили исследование «Российские геномы», чтобы создать открытую базу данных по полногеномным последовательностям более 2 тыс. человек — представителей разных этнических и региональных групп России.

Геном, Twitter и YouTube

В 2015 году в журнале PLOS Computational Biology была опубликована статья, авторы которой назвали астрономию, геномику, Twitter и YouTube главными поставщиками потоков больших данных. И спрогнозировали, как вырастут эти потоки к 2025 году

Геномная картина России

Посёлок Борисовка, Белгородская область. В центральной районной больнице в восемь утра теснее, чем обычно. Местные жители приходят семьями и, сверяясь со стрелочками на стенах, направляются в процедурный кабинет. Заходят сразу по трое, что не смущает ни врачей, ни тех, кто в очереди. Выходят с ватой в сгибе локтя и сувенирными футболками с эмблемой «Российские геномы» — только что они стали участниками этого проекта.

— Жена сказала, вот я и пришёл, — пожимает плечами мужчина средних лет, не совсем понимая, зачем серьёзным людям в белом вдруг понадобилась его кровь.

К участию в проекте привлекали группы из трёх человек: родителей и ребёнка старше 18 лет. Перед сдачей крови каждый заполнял анкету. Главный вопрос: «Ваши бабушка и дедушка родились в этой местности?» Именно благодаря коренным жителям исследователи смогут построить геномную картину региона. Кровь уже сдали в Архангельской, Псковской, Новгородской областях, Приморском и Хабаровском крае, в Твери, Нижнем Новгороде, Красноярске.

В базе данных «Российских геномов» каждому образцу ДНК присваивают шифр, чтобы сохранить анонимность, поэтому исследователи знают только пол, год рождения и этническую или региональную группу, к которой относится донор. Данные хранятся в «облаках»: любой исследователь в любой точке мира должен иметь к ним доступ.

— Первое, что мы хотим понять: как шло расселение древнего человека, как поселения контактировали между собой и обменивались генетической информацией. Следы этих процессов можно увидеть в геномах современных людей, — рассказывает генетик Андрей Шевченко из центра им. Ф. Г. Добржанского. — Другая сторона исследования медицинская: разные народы имеют предрасположенность к разным заболеваниям, и это отчасти определяется генами.

Какие наследственные заболевания характерны для различных групп населения России, как раз предстоит выяснить.

— Сейчас лечение назначают почти вслепую, поэтому одним таблетки помогают, другим нет, — поясняет Шевченко. — Всему есть причина, и она кроется в генетических особенностях, в мутациях, унаследованных от предков, и в среде обитания.

Уточнение важное, потому что гены определяют не всё. Если говорить математическим языком, два умножить на три равно шесть. Чей вклад здесь больше: двойки или тройки? Невозможно сказать. Генетики свою часть задачи решают с помощью секвенирования.

— С каждого генома мы получаем несколько десятков миллионов фрагментов средней длиной 100–150 пар нуклеотидов, они занимают примерно полтерабайта памяти.

У нас хранятся в электронном виде данные 60 обработанных геномов и 42 необработанных, так называемых сырых ридов. После получения сырых ридов в работу включаются биоинформатики, которые контролируют качество материала, проверяют, какова длина и глубина покрытия генома. Нам нужна глубина покрытия не менее 3Х, то есть каждая буква генома должна быть прочитана не менее 30 раз. Длина покрытия — не менее 80 %, — рассказывает главный научный сотрудник Центра геномной биоинформатики им. Ф. Г. Добржанского Владимир Брюхин.

Этнические группы русских

Где собирают геномы

Болезни и миграции

Речь идёт о колоссальной работе с непременным контролем качества на каждом этапе. Когда материал подготовлен, учёные сравнивают частоту мутаций в генах, выясняют наличие однонуклеотидных полиморфизмов, влияющих и не влияющих на работу генов. По этим данным можно не только определить предрасположенность к заболеваниям в каждой популяции, но и выяснить их родство, а также пути миграции предков.

Первая расшифровка человеческого генома, завершившаяся в начале 2000-х, стоила миллиарды долларов. За 15 лет цена упала, но по-прежнему остаётся баснословной: в России полногеномное секвенирование стоит около 5 тыс. долларов. За рубежом дешевле, но российские законы запрещают вывозить из страны образцы ДНК.

— В Европе цена секвенирования полного генома человека ниже тысячи долларов, в Японии и Китае — 600–700 долларов. Вдобавок мест, где это можно сделать, совсем немного: Москва, Петербург да Новосибирск. Пока нам удалось получить средства и отсеквенировать чуть более сотни индивидуальных геномов, — резюмирует Владимир Брюхин.

На сегодня в рамках проекта «Российские геномы» собрано свыше 1,5 тыс. образцов крови. Контроль качества прошли около 700 образцов. Всего исследователи планируют собрать их около 3 тысяч.

Этнические нерусские группы

Телеграм: t.me/ainewsline

Источник: kot.sh



		Секвенируй меня полностью
МЕНЮ Главная страница Поиск Регистрация на сайте Помощь проекту Архив новостей ТЕМЫ Новости ИИ Голосовой помощник Городские сумасшедшие ИИ в медицине ИИ проекты Искусственные нейросети Искусственный интеллект Слежка за людьми Угроза ИИ Разработка ИИ Атаки на ИИ ИИ теория Компьютерные науки Машинное обуч. (Ошибки) Машинное обучение Машинный перевод Нейронные сети начинающим Психология ИИ Реализация ИИ Реализация нейросетей Создание беспилотных авто Трезво про ИИ Философия ИИ Внедрение ИИ Big data Генетические алгоритмы Капсульные нейросети Основы нейронных сетей Промпты. Генеративные запросы Распознавание лиц Распознавание образов Распознавание речи Творчество ИИ Техническое зрение Чат-боты Работа разума и сознание Изучение сна Изучение сознания Нейроинтерфейс Психология Работа мозга Работа памяти Работа разума Модель мозга Модель мозга Робототехника, БПЛА Беспилотные автомобили БПЛА Робототехника Трансгуманизм Трансгуманизм Обработка текста Анализ социальных сетей Компьютерная лингвистика Лингвистика Поисковые алгоритмы Теория эволюции Головной мозг Нейронные сети Поведение животных Теория эволюции Дополненная реальность Виртулаьная реальность Дополненная реальность Железо Интернет вещей Квантовый компьютер Нейронные процессоры облачные вычисления Суперкомпьютеры Киберугрозы Кибербезопасность Научный мир Методы исследования Наука и образование Семинары ИТ индустрия ИТ-гиганты Новости ит Разработка ПО Разработка ПО Теория алгоритмов Теория информации Кластеризация Математика Актуальная математика Статистика Теория вероятности Теория информации Теория хаоса Цифровая экономика Технология блокчейн Цифровая экономика Авторизация RSS RSS новости		2019-05-19 06:00 Теория эволюции Сначала короткий ликбез для тех, кто ещё не знает или уже забыл, что означают некоторые слова из трёх букв: ДНК и ген. Строение и форма организмов, в том числе человека, определяются белками, структура которых зашифрована в дезоксирибонуклеиновой кислоте (ДНК). Она представляет собой спираль из двух переплетённых цепей. Каждая цепь состоит из четырёх видов звеньев-нуклеотидов, обозначаемых буквами: А, Т, Г, Ц. Последовательность нуклеотидов определяет свойства кодируемого белка. Участок ДНК, кодирующий структуру одного вида белка, называется «ген», а совокупность наследственного материала организма — «геном». Одним из величайших прорывов XX века стал вывод, что ДНК можно прочитать, словно это текст, и понять индивидуальные особенности организма. А если прочитать ДНК разных организмов, можно понять, насколько близки этносы, как люди расселялись по планете и чем обусловлены наследственные заболевания. Над первой в истории расшифровкой человеческого генома учёные бились больше десяти лет. В 2003-м эта задача была решена. Дальше процесс пошёл быстрее благодаря совершенствованию технологии секвенирования (от англ. sequence — последовательность), то есть определения порядка нуклеотидов ДНК. Очень много данных Современная геномика — область, где данных чрезвычайно много. Особенно сейчас, когда учёные пытаются сделать медицину персонализированной, основанной на информации о клеточном строении каждого отдельного человека. Лаборатории по всему миру ежегодно собирают терабайты и петабайты информации, а данные биобанков удваиваются каждые семь месяцев. — Если в одном и том же участке гена у одного человека стоит буква А, а у другого Ц, это патогенная мутация или норма? Единственная возможность ответить на этот вопрос — исследовать как можно больше людей, посмотреть частоту данной мутации в популяции, выяснить, больны или здоровы её носители. Некоторые мутации встречаются часто, и их легко идентифицировать, но есть и очень редкие — одна на миллион. Именно поэтому в мире сейчас активно накапливают генетическую информацию, — рассказывает Андрей Афанасьев, гендиректор компании iBinom, старший научный сотрудник лаборатории функционального анализа генома МФТИ, на конференции «Яндекса» «Data & Science: биоинформатика». В 2008 году учёные из Азии, Европы, Африки, США и Латинской Америки включились в беспрецедентное по масштабам исследование «1 000 геномов». Целью проекта было создание максимально подробной карты генетических вариаций человека. Исследователи планировали секвенировать геномы по крайней мере тысячи анонимных участников — представителей разных этнических групп. Проект завершился в 2015 году с перевыполнением плана: секвенировали 2,5 тыс. геномов представителей 26 популяций из 5 регионов мира; описали свыше 88 млн генетических вариаций. Наша страна в проект «1 000 геномов» не попала и теперь навёрстывает упущенное. В 2015 году сотрудники Центра геномной биоинформатики им. Ф. Г. Добржанского Санкт-Петербургского госуниверситета запустили исследование «Российские геномы», чтобы создать открытую базу данных по полногеномным последовательностям более 2 тыс. человек — представителей разных этнических и региональных групп России. Геном, Twitter и YouTube В 2015 году в журнале PLOS Computational Biology была опубликована статья, авторы которой назвали астрономию, геномику, Twitter и YouTube главными поставщиками потоков больших данных. И спрогнозировали, как вырастут эти потоки к 2025 году Геномная картина России Посёлок Борисовка, Белгородская область. В центральной районной больнице в восемь утра теснее, чем обычно. Местные жители приходят семьями и, сверяясь со стрелочками на стенах, направляются в процедурный кабинет. Заходят сразу по трое, что не смущает ни врачей, ни тех, кто в очереди. Выходят с ватой в сгибе локтя и сувенирными футболками с эмблемой «Российские геномы» — только что они стали участниками этого проекта. — Жена сказала, вот я и пришёл, — пожимает плечами мужчина средних лет, не совсем понимая, зачем серьёзным людям в белом вдруг понадобилась его кровь. К участию в проекте привлекали группы из трёх человек: родителей и ребёнка старше 18 лет. Перед сдачей крови каждый заполнял анкету. Главный вопрос: «Ваши бабушка и дедушка родились в этой местности?» Именно благодаря коренным жителям исследователи смогут построить геномную картину региона. Кровь уже сдали в Архангельской, Псковской, Новгородской областях, Приморском и Хабаровском крае, в Твери, Нижнем Новгороде, Красноярске. В базе данных «Российских геномов» каждому образцу ДНК присваивают шифр, чтобы сохранить анонимность, поэтому исследователи знают только пол, год рождения и этническую или региональную группу, к которой относится донор. Данные хранятся в «облаках»: любой исследователь в любой точке мира должен иметь к ним доступ. — Первое, что мы хотим понять: как шло расселение древнего человека, как поселения контактировали между собой и обменивались генетической информацией. Следы этих процессов можно увидеть в геномах современных людей, — рассказывает генетик Андрей Шевченко из центра им. Ф. Г. Добржанского. — Другая сторона исследования медицинская: разные народы имеют предрасположенность к разным заболеваниям, и это отчасти определяется генами. Какие наследственные заболевания характерны для различных групп населения России, как раз предстоит выяснить. — Сейчас лечение назначают почти вслепую, поэтому одним таблетки помогают, другим нет, — поясняет Шевченко. — Всему есть причина, и она кроется в генетических особенностях, в мутациях, унаследованных от предков, и в среде обитания. Уточнение важное, потому что гены определяют не всё. Если говорить математическим языком, два умножить на три равно шесть. Чей вклад здесь больше: двойки или тройки? Невозможно сказать. Генетики свою часть задачи решают с помощью секвенирования. — С каждого генома мы получаем несколько десятков миллионов фрагментов средней длиной 100–150 пар нуклеотидов, они занимают примерно полтерабайта памяти. У нас хранятся в электронном виде данные 60 обработанных геномов и 42 необработанных, так называемых сырых ридов. После получения сырых ридов в работу включаются биоинформатики, которые контролируют качество материала, проверяют, какова длина и глубина покрытия генома. Нам нужна глубина покрытия не менее 3Х, то есть каждая буква генома должна быть прочитана не менее 30 раз. Длина покрытия — не менее 80 %, — рассказывает главный научный сотрудник Центра геномной биоинформатики им. Ф. Г. Добржанского Владимир Брюхин. Этнические группы русских Где собирают геномы Болезни и миграции Речь идёт о колоссальной работе с непременным контролем качества на каждом этапе. Когда материал подготовлен, учёные сравнивают частоту мутаций в генах, выясняют наличие однонуклеотидных полиморфизмов, влияющих и не влияющих на работу генов. По этим данным можно не только определить предрасположенность к заболеваниям в каждой популяции, но и выяснить их родство, а также пути миграции предков. Первая расшифровка человеческого генома, завершившаяся в начале 2000-х, стоила миллиарды долларов. За 15 лет цена упала, но по-прежнему остаётся баснословной: в России полногеномное секвенирование стоит около 5 тыс. долларов. За рубежом дешевле, но российские законы запрещают вывозить из страны образцы ДНК. — В Европе цена секвенирования полного генома человека ниже тысячи долларов, в Японии и Китае — 600–700 долларов. Вдобавок мест, где это можно сделать, совсем немного: Москва, Петербург да Новосибирск. Пока нам удалось получить средства и отсеквенировать чуть более сотни индивидуальных геномов, — резюмирует Владимир Брюхин. На сегодня в рамках проекта «Российские геномы» собрано свыше 1,5 тыс. образцов крови. Контроль качества прошли около 700 образцов. Всего исследователи планируют собрать их около 3 тысяч. Этнические нерусские группы Телеграм: t.me/ainewsline Источник: kot.sh Комментарии:

Секвенируй меня полностью

Комментарии: