Нейросеть отучилась от предвзятости саморегуляцией выборки

2019-01-28 17:48

методы распознавания образов, искусственный интеллект

Американские разработчики представили алгоритм, который избавляет распознавание лиц от предвзятости. Для этого они добавили к сверточной нейросети, распознающей изображения людей, нейросеть-автокодировщик, которая следит за тем, как хорошо распознаются те или иные объекты, и меняет на основе этого обучающую выборку. Ученым удалось снизить предвзятость использованных в выборке данных с 28 до 9 процентов, при этом точность распознавания выросла. Результаты работы исследователи представят на конференции AIES 2019, которая сейчас проходит в Гонолулу; также доступен препринт статьи.

Одна из проблем, которая до сих пор существует в области машинного обучения, — это часто возникающая предвзятость алгоритмов: из-за особенностей собранных выборок, в которых часто недостает тех или иных данных, результаты их работы могут быть, например, выраженно сексистскими или расистскими. Бороться с такой предвзятостью предлагают по-разному: собирая более разнообразные данные (что может быть очень затратно и также предвзято, учитывая, что разметка таких данных часто проводится людьми) или же оптимизируя работу алгоритмов.

Исследователи из Массачусетского технологического института под руководством Александра Амини (Alexander Amini) предложили новый способ избавления датасетов, содержащих лица людей, от предвзятости. Они решили добавить «выравнивание» выборки прямо в алгоритм глубокого обучения, который направлен на решение определенной задачи, например, на распознавание лица. Для этого они добавили к алгоритму нейросеть-автокодировщик, задача которой — подробно изучить распределение данных в обучающей выборке, анализируя результаты работы основной нейросети, которая определяет лица. К примеру, если в основе алгоритма распознавания лица находится бинарный классификатор, который определяет наличие волос на голове человека, и плохо распознает лысых людей, нейросеть-автокодировщик, которая избавляет его от предвзятости, получает сигнал о том, что для обучения ему нужно взять из выборки больше изображений лысых людей. Всего ученые использовали четыре параметра «настройки» используемых данных: они попытались избавить алгоритм от предвзятости в вопросах цвета кожи, пола человека, количества волос у него на голове и поворота головы.

Ученые взяли 400 тысяч изображений лиц: 80 процентов были взяты для обучения, а 20 процентов — для тренировки. В качестве основы алгоритма распознавания лиц была взята сверточная нейросеть. Ученые отметили, что в процессе обучения вероятность получения четырех случайных изображений, которые бы сильно отличались друг от друга, возрастала. Как утверждают сами авторы работы, им удалось снизить предвзятость работы алгоритма в вопросах использования данных из выборки с 28 до 9 процентов, при этом точность распознавания увеличилась с 95 до 97 процентов.

Авторы работы отметили, что та часть алгоритма, которая отвечала за избавление выборки от предвзятости, обучалась без учителя. По их мнению, такой способ может помочь системам компьютерного зрения использовать более взвешенные выборки, в конечном итоге избавляя алгоритмы от возможных проявлений дискриминации.

Иногда предвзятость больших данных становится и объектом исследования. Например, в прошлом году ученые использовали большое количество текстов, опубликованных в течение XX века, чтобы проследить за тем, как со временем менялось отношение к женщинам и азиатам.

Елизавета Ивтушок

Телеграм: t.me/ainewsline

Источник: nplus1.ru



		Нейросеть отучилась от предвзятости саморегуляцией выборки
МЕНЮ Главная страница Поиск Регистрация на сайте Помощь проекту Архив новостей ТЕМЫ Новости ИИ Голосовой помощник Городские сумасшедшие ИИ в медицине ИИ проекты Искусственные нейросети Искусственный интеллект Слежка за людьми Угроза ИИ Разработка ИИ Атаки на ИИ ИИ теория Компьютерные науки Машинное обуч. (Ошибки) Машинное обучение Машинный перевод Нейронные сети начинающим Психология ИИ Реализация ИИ Реализация нейросетей Создание беспилотных авто Трезво про ИИ Философия ИИ Внедрение ИИ Big data Генетические алгоритмы Капсульные нейросети Основы нейронных сетей Промпты. Генеративные запросы Распознавание лиц Распознавание образов Распознавание речи Творчество ИИ Техническое зрение Чат-боты Работа разума и сознание Изучение сна Изучение сознания Нейроинтерфейс Психология Работа мозга Работа памяти Работа разума Модель мозга Модель мозга Робототехника, БПЛА Беспилотные автомобили БПЛА Робототехника Трансгуманизм Трансгуманизм Обработка текста Анализ социальных сетей Компьютерная лингвистика Лингвистика Поисковые алгоритмы Теория эволюции Головной мозг Нейронные сети Поведение животных Теория эволюции Дополненная реальность Виртулаьная реальность Дополненная реальность Железо Интернет вещей Квантовый компьютер Нейронные процессоры облачные вычисления Суперкомпьютеры Киберугрозы Кибербезопасность Научный мир Методы исследования Наука и образование Семинары ИТ индустрия ИТ-гиганты Новости ит Разработка ПО Разработка ПО Теория алгоритмов Теория информации Кластеризация Математика Актуальная математика Статистика Теория вероятности Теория информации Теория хаоса Цифровая экономика Технология блокчейн Цифровая экономика Авторизация RSS RSS новости		2019-01-28 17:48 методы распознавания образов, искусственный интеллект Американские разработчики представили алгоритм, который избавляет распознавание лиц от предвзятости. Для этого они добавили к сверточной нейросети, распознающей изображения людей, нейросеть-автокодировщик, которая следит за тем, как хорошо распознаются те или иные объекты, и меняет на основе этого обучающую выборку. Ученым удалось снизить предвзятость использованных в выборке данных с 28 до 9 процентов, при этом точность распознавания выросла. Результаты работы исследователи представят на конференции AIES 2019, которая сейчас проходит в Гонолулу; также доступен препринт статьи. Одна из проблем, которая до сих пор существует в области машинного обучения, — это часто возникающая предвзятость алгоритмов: из-за особенностей собранных выборок, в которых часто недостает тех или иных данных, результаты их работы могут быть, например, выраженно сексистскими или расистскими. Бороться с такой предвзятостью предлагают по-разному: собирая более разнообразные данные (что может быть очень затратно и также предвзято, учитывая, что разметка таких данных часто проводится людьми) или же оптимизируя работу алгоритмов. Исследователи из Массачусетского технологического института под руководством Александра Амини (Alexander Amini) предложили новый способ избавления датасетов, содержащих лица людей, от предвзятости. Они решили добавить «выравнивание» выборки прямо в алгоритм глубокого обучения, который направлен на решение определенной задачи, например, на распознавание лица. Для этого они добавили к алгоритму нейросеть-автокодировщик, задача которой — подробно изучить распределение данных в обучающей выборке, анализируя результаты работы основной нейросети, которая определяет лица. К примеру, если в основе алгоритма распознавания лица находится бинарный классификатор, который определяет наличие волос на голове человека, и плохо распознает лысых людей, нейросеть-автокодировщик, которая избавляет его от предвзятости, получает сигнал о том, что для обучения ему нужно взять из выборки больше изображений лысых людей. Всего ученые использовали четыре параметра «настройки» используемых данных: они попытались избавить алгоритм от предвзятости в вопросах цвета кожи, пола человека, количества волос у него на голове и поворота головы. Ученые взяли 400 тысяч изображений лиц: 80 процентов были взяты для обучения, а 20 процентов — для тренировки. В качестве основы алгоритма распознавания лиц была взята сверточная нейросеть. Ученые отметили, что в процессе обучения вероятность получения четырех случайных изображений, которые бы сильно отличались друг от друга, возрастала. Как утверждают сами авторы работы, им удалось снизить предвзятость работы алгоритма в вопросах использования данных из выборки с 28 до 9 процентов, при этом точность распознавания увеличилась с 95 до 97 процентов. Alexander Amini et al. / MIT, 2019 Авторы работы отметили, что та часть алгоритма, которая отвечала за избавление выборки от предвзятости, обучалась без учителя. По их мнению, такой способ может помочь системам компьютерного зрения использовать более взвешенные выборки, в конечном итоге избавляя алгоритмы от возможных проявлений дискриминации. Иногда предвзятость больших данных становится и объектом исследования. Например, в прошлом году ученые использовали большое количество текстов, опубликованных в течение XX века, чтобы проследить за тем, как со временем менялось отношение к женщинам и азиатам. Елизавета Ивтушок Телеграм: t.me/ainewsline Источник: nplus1.ru Комментарии:

Нейросеть отучилась от предвзятости саморегуляцией выборки

Комментарии: