Google AI выпустила библиотеку с результатами исследования распутывания представлений

2019-05-08 16:58

алгоритмы машинного обучения, ИИ проекты

Google AI опубликовала библиотеку disentanglement_lib, которая содержит 10800 вариационных автоэнкодеров, обученных на семи датасетах. Эта библиотека призвана помочь исследователям по всему миру решить одну из главных проблем глубокого обучения — неспособность использовать многомерные данные для генерации полезных представлений методами без учителя. Один из подходов, позволяющий решить эту проблему, называется распутывание представлений. Он заключается в том, чтобы путем обучения модели построить вектор независимых параметров, где каждый из них означает отдельный фактор (положение, размер, угол вращения, цвет и т.д.)

Визуализация независимых факторов датасета Shapes3D: цвет пола (вверху слева), цвет стены (вверху посередине), цвет объекта (вверху справа), размер объекта (внизу слева), форма объекта (внизу посередине) и угол поворота камеры (внизу справа).

Цель реализации библиотеки — проведение крупномасштабного эмперического исследования нескольких моделей вариационных автоенкодеров, предложенных сообществом для распутывания представлений без учителя. Это позволило оценить модели единым образом.

Содержимое библиотеки

Модели, включенные в исследование:

BetaVAE
FactorVAE
BetaTCVAE
DIP-VAE I / II
AnnealedVAE

Датасеты, на которых обучались модели:

dSprites
Color-dSprites
Noisy-dSprites
Scream-dSprites
SmallNORB
Cars3D
Shapes3D

Также результаты оценивались разными метриками: BetaVAE score, FactorVAE score, Mutual Information Gap, SAP score, DCI и MCE.

Выводы

Основные выводы исследования, сформулированные исследователями:

Нет каких-либо эмпирических доказательств того, что рассматриваемые модели могут использоваться для надежного изучения распутанных представлений без учителя, поскольку случайные начальные числа и гиперпараметры имеют большее значение, чем выбор модели.

На графиках показано распределение значений метрики FactorVAE, полученных разными моделями на датасете Shapes3D. На правом графике показано распределение значений при изменении моделей, а на правом — при изменении параметра регуляризации в модели FactorVAE. **Модели:** 0 — BetaVAE, 1 — FactorVAE, 2 — BetaTCVAE, 3 — DIP-VAE-I, 4 — DIP-VAE-II, 5 — AnnealedVAE.

Для рассматриваемых моделей и датасетов нет возможности проверить предположение, что распутывание полезно для последующих задач. Например, что с распутанными представлениями можно обучаться на меньшем количестве размеченных наблюдений.

В Google AI подсчитали, что воспроизведение обучения всех моделей в исследовании потребует вычислительных затрат приблизительно в 2,5 года работы GPU. Таким образом, исследование сильно облегчило задачу для сообщества.

Источник: neurohive.io



		Google AI выпустила библиотеку с результатами исследования распутывания представлений
МЕНЮ Искусственный интеллект Поиск Регистрация на сайте Помощь проекту ТЕМЫ Новости ИИ Искусственный интеллект Голосовой помощник Городские сумасшедшие ИИ в медицине ИИ проекты Искусственные нейросети Слежка за людьми Угроза ИИ Разработка ИИ ИИ теория Компьютерные науки Машинное обуч. (Ошибки) Машинное обучение Машинный перевод Реализация ИИ Реализация нейросетей Создание беспилотных авто Трезво про ИИ Философия ИИ Внедрение ИИ Big data Генетические алгоритмы Капсульные нейросети Основы нейронных сетей Распознавание лиц Распознавание образов Распознавание речи Техническое зрение Чат-боты Работа разума и сознание Изучение сна Изучение сознания Психология Работа головного мозга Работа памяти Работа разума Модель мозга Модель мозга Робототехника, БПЛА Беспилотные автомобили БПЛА Робототехника Трансгуманизм Трансгуманизм Обработка текста Анализ социальных сетей Компьютерная лингвистика Лингвистика Поисковые алгоритмы Теория эволюции Головной мозг Нейронные сети Поведение животных Теория эволюции Дополненная реальность Виртулаьная реальность Дополненная реальность Железо Интернет вещей Квантовые компьютеры Нейронные процессоры облачные вычисления Суперкомпьютеры Киберугрозы Кибербезопасность Научный мир Методы исследования Наука и образование Семинары ИТ индустрия ИТ-гиганты Новости ит Разработка ПО Разработка ПО Теория алгоритмов Теория информации Кластеризация Математика Актуальная математика Статистика Теория вероятности Теория информации Теория хаоса Цифровая экономика Технология блокчейн Цифровая экономика Авторизация RSS RSS новости		2019-05-08 16:58 алгоритмы машинного обучения, ИИ проекты Google AI опубликовала библиотеку *disentanglement_lib, которая содержит 10800 вариационных автоэнкодеров, обученных на семи датасетах. Эта библиотека призвана помочь исследователям по всему миру решить одну из главных проблем глубокого обучения — неспособность использовать многомерные данные для генерации полезных представлений методами без учителя. Один из подходов, позволяющий решить эту проблему, называется распутывание представлений. Он заключается в том, чтобы путем обучения модели построить вектор независимых параметров, где каждый из них означает отдельный фактор (положение, размер, угол вращения, цвет и т.д.) Визуализация независимых факторов датасета Shapes3D: цвет пола (вверху слева), цвет стены (вверху посередине), цвет объекта (вверху справа), размер объекта (внизу слева), форма объекта (внизу посередине) и угол поворота камеры (внизу справа). Цель реализации библиотеки — проведение крупномасштабного эмперического исследования нескольких моделей вариационных автоенкодеров, предложенных сообществом для распутывания представлений без учителя. Это позволило оценить модели единым образом. Содержимое библиотеки* Модели, включенные в исследование: BetaVAE FactorVAE BetaTCVAE DIP-VAE I / II AnnealedVAE Датасеты, на которых обучались модели: dSprites Color-dSprites Noisy-dSprites Scream-dSprites SmallNORB Cars3D Shapes3D Также результаты оценивались разными метриками: BetaVAE score, FactorVAE score, Mutual Information Gap, SAP score, DCI и MCE. Выводы Основные выводы исследования, сформулированные исследователями: Нет каких-либо эмпирических доказательств того, что рассматриваемые модели могут использоваться для надежного изучения распутанных представлений без учителя, поскольку случайные начальные числа и гиперпараметры имеют большее значение, чем выбор модели. На графиках показано распределение значений метрики FactorVAE, полученных разными моделями на датасете Shapes3D. На правом графике показано распределение значений при изменении моделей, а на правом — при изменении параметра регуляризации в модели FactorVAE. Модели: 0 — BetaVAE, 1 — FactorVAE, 2 — BetaTCVAE, 3 — DIP-VAE-I, 4 — DIP-VAE-II, 5 — AnnealedVAE. Для рассматриваемых моделей и датасетов нет возможности проверить предположение, что распутывание полезно для последующих задач. Например, что с распутанными представлениями можно обучаться на меньшем количестве размеченных наблюдений. В Google AI подсчитали, что воспроизведение обучения всех моделей в исследовании потребует вычислительных затрат приблизительно в 2,5 года работы GPU. Таким образом, исследование сильно облегчило задачу для сообщества. Источник: neurohive.io Комментарии:

Google AI выпустила библиотеку с результатами исследования распутывания представлений

Комментарии: