Цифровые данные по биоразнообразию: как мы стали обладателями сокровищ |
||
МЕНЮ Искусственный интеллект Поиск Регистрация на сайте Помощь проекту ТЕМЫ Новости ИИ Искусственный интеллект Разработка ИИГолосовой помощник Городские сумасшедшие ИИ в медицине ИИ проекты Искусственные нейросети Слежка за людьми Угроза ИИ ИИ теория Внедрение ИИКомпьютерные науки Машинное обуч. (Ошибки) Машинное обучение Машинный перевод Нейронные сети начинающим Реализация ИИ Реализация нейросетей Создание беспилотных авто Трезво про ИИ Философия ИИ Big data Работа разума и сознаниеМодель мозгаРобототехника, БПЛАТрансгуманизмОбработка текстаТеория эволюцииДополненная реальностьЖелезоКиберугрозыНаучный мирИТ индустрияРазработка ПОТеория информацииМатематикаЦифровая экономика
Генетические алгоритмы Капсульные нейросети Основы нейронных сетей Распознавание лиц Распознавание образов Распознавание речи Техническое зрение Чат-боты Авторизация |
2020-06-20 20:00 Получить базу из 100,000 записей за 5 минут на домашний компьютер? Еще 20 лет назад для ученых-биологов это было в области сказок. Если нужны данные в дополнение к своим — езди по коллекциям (в разных городах!), договаривайся со знакомыми коллегами, переписывай вручную из книжек. Сейчас же — 5 минут настройки фильтров, и множество записей уже ждут аналитической обработки. И с каждым годом объемы и типы доступной информации только возрастают. Найти их можно в базах данных биоразнообразия (biodiversity database). Уже создано большое число таких порталов, каждый из которых работает с определенными темами. Так, можно выделить таксономические базы и базы «коллекционные». Первые включают информацию о положении таксона в системе живого мира, валидных названиях, синонимах и родственных связях между таксонами (например, TROPICOS). Вторые работают на уровне отдельных организмов и предоставляют информацию о их распространении, внешних признаках. Сюда же включены фотографии, записи голосов птиц, видео, последовательности ДНК и пр. Такие базы можно разделить на «оцифрованные коллекции» и на «аггрегаторы». Примером оцифрованных коллекций может служить портал Цифрового гербария МГУ имени М.В. Ломоносова. В рамках проекта отсканировано более 1 000 000 гербарных образцов с конца XIX века до наших дней, а также проведена оцифровка этикеток (каждое засушенное растение в научном гербарии снабжается этикеткой: где собрано, кем и когда). Для 571 956 образцов сделана геопривязка к карте. Аггрегаторы пополняются разными людьми и организациями. У каждого проекта свои требования к типам данных, их региональной приуроченности и т.д. Примером может служить — «GBIF» — база по распространению всех видов живых организмов. Она насчитывает 1 411 011 811 записей из 53 090 датасетов*. Скачать их может любой — достаточно пройти регистрацию на портале. А вот добавлять можно лишь от лица научных организаций и в определенном формате. Некоторые порталы собирают данные более локальных проектов. Таков, например, «Catalog of Life», который аккумулирует записи из 171 базы. К этой же категории относится и «the Encyclopedia of Life». Для интересующих таксонов там можно посмотреть и распространение (из GBIF), и значения отдельных признаков (из TRY-database) и еще ряд параметров. Для того, чтобы выбрать наиболее полезную лично Вам базу данных, необходимо определиться с несколькими пунктами:
Большинство международных сайтов ведется на английском языке, поэтому для наиболее релевантного поиска таких порталов лучше пользоваться поиском Google и вводить запрос на английском. Ниже приведено несколько порталов, которые могут быть интересны не только ученым, но и всем любителям живой природы.
*Все показатели баз приводятся на 21.05.2020 Ксения Дудова Ссылки на упоминаемые базы
Источник: m.vk.com Комментарии: |
|