Цифровые данные по биоразнообразию: как мы стали обладателями сокровищ

2020-06-20 20:00

Теория эволюции, Философия ИИ, Работа разума

Получить базу из 100,000 записей за 5 минут на домашний компьютер? Еще 20 лет назад для ученых-биологов это было в области сказок. Если нужны данные в дополнение к своим — езди по коллекциям (в разных городах!), договаривайся со знакомыми коллегами, переписывай вручную из книжек. Сейчас же — 5 минут настройки фильтров, и множество записей уже ждут аналитической обработки. И с каждым годом объемы и типы доступной информации только возрастают. Найти их можно в базах данных биоразнообразия (biodiversity database).

Уже создано большое число таких порталов, каждый из которых работает с определенными темами. Так, можно выделить таксономические базы и базы «коллекционные». Первые включают информацию о положении таксона в системе живого мира, валидных названиях, синонимах и родственных связях между таксонами (например, TROPICOS). Вторые работают на уровне отдельных организмов и предоставляют информацию о их распространении, внешних признаках. Сюда же включены фотографии, записи голосов птиц, видео, последовательности ДНК и пр. Такие базы можно разделить на «оцифрованные коллекции» и на «аггрегаторы». Примером оцифрованных коллекций может служить портал Цифрового гербария МГУ имени М.В. Ломоносова. В рамках проекта отсканировано более 1 000 000 гербарных образцов с конца XIX века до наших дней, а также проведена оцифровка этикеток (каждое засушенное растение в научном гербарии снабжается этикеткой: где собрано, кем и когда). Для 571 956 образцов сделана геопривязка к карте.

Аггрегаторы пополняются разными людьми и организациями. У каждого проекта свои требования к типам данных, их региональной приуроченности и т.д. Примером может служить — «GBIF» — база по распространению всех видов живых организмов. Она насчитывает 1 411 011 811 записей из 53 090 датасетов*. Скачать их может любой — достаточно пройти регистрацию на портале. А вот добавлять можно лишь от лица научных организаций и в определенном формате.

Некоторые порталы собирают данные более локальных проектов. Таков, например, «Catalog of Life», который аккумулирует записи из 171 базы. К этой же категории относится и «the Encyclopedia of Life». Для интересующих таксонов там можно посмотреть и распространение (из GBIF), и значения отдельных признаков (из TRY-database) и еще ряд параметров.

Для того, чтобы выбрать наиболее полезную лично Вам базу данных, необходимо определиться с несколькими пунктами:

какие живые организмы Вас интересуют?
какой регион Вас интересует?
какого типа данные необходимы? (фото, GPS-точки, таксономическое положение)

Большинство международных сайтов ведется на английском языке, поэтому для наиболее релевантного поиска таких порталов лучше пользоваться поиском Google и вводить запрос на английском.

Ниже приведено несколько порталов, которые могут быть интересны не только ученым, но и всем любителям живой природы.

iNaturalistКрупный международный портал, куда каждый желающий может добавить свое наблюдение за живой природой. 38 328 497 записей уже доступны на портале. Построен по принципу соцсети. Данные по распространению iNat передает в GBIF, а таксономическую информацию, напротив, получает из «the Plant List». Сайт полностью русифицирован.
AvibaseПосвящена исключительно птицам. И насчитывает 27,521,252 записей. Интересная фишка системы — выбрать свой регион и скачать для него список встречающихся птиц с фотографиями и базовой информацией. Портал частично переведен на русский язык.
ООПТ РоссииПортал, посвященный особо охраняемым природным территориям РФ также позволяет узнать, какие виды живых организмов включены в Красные Книги и в каких ООПТ встречаются. Есть поиск по русскоязычным названиям.
Млекопитающие РоссииНедавно созданный портал обладает очень понятной структурой сайта и уже содержит 7663 фотографий млекопитающих нашей страны. Пользователи могут добавлять свои данные в свободном режиме. Хорошо подойдет для знакомства с фауной страны.

*Все показатели баз приводятся на 21.05.2020

Ксения Дудова

Ссылки на упоминаемые базы

Цифровой гербарий МГУ
TROPICOS
GBIF
Catalog of Life
the Encyclopedia of Life
TRY-database
iNaturalist
Avibase
ООПТ России
Млекопитающие России

Телеграм: t.me/ainewsline

Источник: m.vk.com



		Цифровые данные по биоразнообразию: как мы стали обладателями сокровищ
МЕНЮ Главная страница Поиск Регистрация на сайте Помощь проекту Архив новостей ТЕМЫ Новости ИИ Голосовой помощник Городские сумасшедшие ИИ в медицине ИИ проекты Искусственные нейросети Искусственный интеллект Слежка за людьми Угроза ИИ Разработка ИИ Атаки на ИИ ИИ теория Компьютерные науки Машинное обуч. (Ошибки) Машинное обучение Машинный перевод Нейронные сети начинающим Психология ИИ Реализация ИИ Реализация нейросетей Создание беспилотных авто Трезво про ИИ Философия ИИ Внедрение ИИ Big data Генетические алгоритмы Капсульные нейросети Основы нейронных сетей Промпты. Генеративные запросы Распознавание лиц Распознавание образов Распознавание речи Творчество ИИ Техническое зрение Чат-боты Работа разума и сознание Изучение сна Изучение сознания Нейроинтерфейс Психология Работа мозга Работа памяти Работа разума Модель мозга Модель мозга Робототехника, БПЛА Беспилотные автомобили БПЛА Робототехника Трансгуманизм Трансгуманизм Обработка текста Анализ социальных сетей Компьютерная лингвистика Лингвистика Поисковые алгоритмы Теория эволюции Головной мозг Нейронные сети Поведение животных Теория эволюции Дополненная реальность Виртулаьная реальность Дополненная реальность Железо Интернет вещей Квантовый компьютер Нейронные процессоры облачные вычисления Суперкомпьютеры Киберугрозы Кибербезопасность Научный мир Методы исследования Наука и образование Семинары ИТ индустрия ИТ-гиганты Новости ит Разработка ПО Разработка ПО Теория алгоритмов Теория информации Кластеризация Математика Актуальная математика Статистика Теория вероятности Теория информации Теория хаоса Цифровая экономика Технология блокчейн Цифровая экономика Авторизация RSS RSS новости		2020-06-20 20:00 Теория эволюции, Философия ИИ, Работа разума Получить базу из 100,000 записей за 5 минут на домашний компьютер? Еще 20 лет назад для ученых-биологов это было в области сказок. Если нужны данные в дополнение к своим — езди по коллекциям (в разных городах!), договаривайся со знакомыми коллегами, переписывай вручную из книжек. Сейчас же — 5 минут настройки фильтров, и множество записей уже ждут аналитической обработки. И с каждым годом объемы и типы доступной информации только возрастают. Найти их можно в базах данных биоразнообразия (biodiversity database). Уже создано большое число таких порталов, каждый из которых работает с определенными темами. Так, можно выделить таксономические базы и базы «коллекционные». Первые включают информацию о положении таксона в системе живого мира, валидных названиях, синонимах и родственных связях между таксонами (например, TROPICOS). Вторые работают на уровне отдельных организмов и предоставляют информацию о их распространении, внешних признаках. Сюда же включены фотографии, записи голосов птиц, видео, последовательности ДНК и пр. Такие базы можно разделить на «оцифрованные коллекции» и на «аггрегаторы». Примером оцифрованных коллекций может служить портал Цифрового гербария МГУ имени М.В. Ломоносова. В рамках проекта отсканировано более 1 000 000 гербарных образцов с конца XIX века до наших дней, а также проведена оцифровка этикеток (каждое засушенное растение в научном гербарии снабжается этикеткой: где собрано, кем и когда). Для 571 956 образцов сделана геопривязка к карте. Аггрегаторы пополняются разными людьми и организациями. У каждого проекта свои требования к типам данных, их региональной приуроченности и т.д. Примером может служить — «GBIF» — база по распространению всех видов живых организмов. Она насчитывает 1 411 011 811 записей из 53 090 датасетов. Скачать их может любой — достаточно пройти регистрацию на портале. А вот добавлять можно лишь от лица научных организаций и в определенном формате. Некоторые порталы собирают данные более локальных проектов. Таков, например, «Catalog of Life», который аккумулирует записи из 171 базы. К этой же категории относится и «the Encyclopedia of Life». Для интересующих таксонов там можно посмотреть и распространение (из GBIF), и значения отдельных признаков (из TRY-database) и еще ряд параметров. Для того, чтобы выбрать наиболее полезную лично Вам базу данных, необходимо определиться с несколькими пунктами: какие живые организмы Вас интересуют? какой регион Вас интересует? какого типа данные необходимы? (фото, GPS-точки, таксономическое положение) Большинство международных сайтов ведется на английском языке, поэтому для наиболее релевантного поиска таких порталов лучше пользоваться поиском Google и вводить запрос на английском. Ниже приведено несколько порталов, которые могут быть интересны не только ученым, но и всем любителям живой природы. iNaturalistКрупный международный портал, куда каждый желающий может добавить свое наблюдение за живой природой. 38 328 497 записей уже доступны на портале. Построен по принципу соцсети. Данные по распространению iNat передает в GBIF, а таксономическую информацию, напротив, получает из «the Plant List». Сайт полностью русифицирован. AvibaseПосвящена исключительно птицам. И насчитывает 27,521,252 записей. Интересная фишка системы — выбрать свой регион и скачать для него список встречающихся птиц с фотографиями и базовой информацией. Портал частично переведен на русский язык. ООПТ РоссииПортал, посвященный особо охраняемым природным территориям РФ также позволяет узнать, какие виды живых организмов включены в Красные Книги и в каких ООПТ встречаются. Есть поиск по русскоязычным названиям. Млекопитающие РоссииНедавно созданный портал обладает очень понятной структурой сайта и уже содержит 7663 фотографий млекопитающих нашей страны. Пользователи могут добавлять свои данные в свободном режиме. Хорошо подойдет для знакомства с фауной страны. Все показатели баз приводятся на 21.05.2020 Ксения Дудова Ссылки на упоминаемые базы Цифровой гербарий МГУ TROPICOS GBIF Catalog of Life the Encyclopedia of Life TRY-database iNaturalist Avibase ООПТ России Млекопитающие России Телеграм: t.me/ainewsline Источник: m.vk.com Комментарии:

Цифровые данные по биоразнообразию: как мы стали обладателями сокровищ

Комментарии: