Microsoft снова доказывает силу синтетических данных для задач компьютерного зрения!

МЕНЮ


Главная страница
Поиск
Регистрация на сайте
Помощь проекту
Архив новостей

ТЕМЫ


Новости ИИРазработка ИИВнедрение ИИРабота разума и сознаниеМодель мозгаРобототехника, БПЛАТрансгуманизмОбработка текстаТеория эволюцииДополненная реальностьЖелезоКиберугрозыНаучный мирИТ индустрияРазработка ПОТеория информацииМатематикаЦифровая экономика

Авторизация



RSS


RSS новости


Современные модели компьютерного зрения с фокусом на человека (Human-centric CV) требуют миллиардов параметров, гигантских датасетов и дорогостоящего инференса. Но можно ли добиться такой же точности, не тратя миллионы?

Исследователи показали: модели можно обучать только на синтетических данных высокого качества — и при этом достигать тех же результатов.

Microsoft представили DAViD — open-source фреймворк, позволяющий создавать цифровых людей с точной геометрией лиц и текстурами.

Проект демонстрирует, как можно использовать синтетические датасеты для:

Предсказания глубины изображения (Depth Prediction)

Оценки поверхностей (Normal Estimation)

Сегментации фона и людей на фото/видео (Background & Human Segmentation)

Почему это круто:

Синтетические данные = пиксельная точность разметки

Почти бесконечное разнообразие сцен, ракурсов, освещения и поз

Прекрасно масштабируются для обучения моделей с нуля или дообучения

Самое приятное, что Microsoft выложили всё в опенсорс:

300?000 сэмплов

Предобученные модели

Исходный код фремйворка

Проект: https://microsoft.github.io/DAViD/

Статья: https://arxiv.org/abs/2507.15365

Github: https://github.com/microsoft/DAViD

Если ты работаешь с human-centric CV — это мощный старт. Даже без реальных данных.


Источник: github.com

Комментарии: