Кстати, тут Microsoft выложили в открытый доступ датасет из 100 000 размеченных изображений лиц и поделились исследованиями про обучение на синтетических данных

МЕНЮ


Главная страница
Поиск
Регистрация на сайте
Помощь проекту
Архив новостей

ТЕМЫ


Новости ИИРазработка ИИВнедрение ИИРабота разума и сознаниеМодель мозгаРобототехника, БПЛАТрансгуманизмОбработка текстаТеория эволюцииДополненная реальностьЖелезоКиберугрозыНаучный мирИТ индустрияРазработка ПОТеория информацииМатематикаЦифровая экономика

Авторизация



RSS


RSS новости


Помните историю, когда Facebook пришлось отказаться от своей системы распознавания лиц и выплатить несколько сотен миллионов долларов штрафа пользователям, на чьих фотках она была обучена? И это далеко не первая и не последняя подобная история. А сегодня сбор качественных и больших датасетов с фотками людей без персональных данных — большая проблема для разработчиков и в целом прогресса в сфере ML. Притом, это касается и систем распознавания лиц, и тех же дипфейков.

Так вот разработчики из Microsoft на практике доказали возможность эффективного обучения на синтетических датасетах, в которых вообще нет персональных данных. А также решили проблемы искажений выборки/разметки и поделились огроменным датасетом, который может использовать любой желающий:

https://microsoft.github.io/FaceSynthetics/


Источник: microsoft.github.io

Комментарии: