LaSOT: масштабный датасет для моделей трекинга объектов

МЕНЮ


Искусственный интеллект
Поиск
Регистрация на сайте
Помощь проекту

ТЕМЫ


Новости ИИРазработка ИИВнедрение ИИРабота разума и сознаниеМодель мозгаРобототехника, БПЛАТрансгуманизмОбработка текстаТеория эволюцииДополненная реальностьЖелезоКиберугрозыНаучный мирИТ индустрияРазработка ПОТеория информацииМатематикаЦифровая экономика

Авторизация



RSS


RSS новости


LaSOT — масштабный датасет для обучения и оценки моделей трекинга объектов. Датасет содержит 1.5 тысяч видеоклипов с объектами 85 разных классов. Всего в датасете более 3.87 миллионов кадров. Каждый клип содержит разметку для одного объекте. Границы объекта на кадрах размечали вручную. 

Описание проблемы

Несмотря на развитие подходов для визуального трекинга, разработка и последующая оценка моделей ограничивается недостатком датасетов, специально предназначенных для трекинга объектов.

Подробнее про датасет

LaSOT — это первый подробно размеченный бенчмарк для обучения и оценки моделей трекинга. Средняя длина видеоклипа в датасете — 2.5 тысяч кадров. При этом целевой объект может исчезать и заново появляться в кадре. Это усложняет для моделей процесс слежки за объектом. Длина видеозаписей позволяет тестировать подходы для продолжительного трекинга объектов. Каждая видеозапись дополнительно размечена текстовым описанием. 

Сравнение существующих датасетов для трекинга объектов по плотности разметки видеозаписей

Создатели протестировали 48 базовых трекеров на LaSOT. Результаты экспериментов и анализ доступны на сайте проекта.


Источник: neurohive.io

Комментарии: