«Черный ящик» нейросетей приоткрылся

2019-03-07 20:30

Давайте представим ситуацию: маленькому ребенку преподносят картинку с различными фигурами и просят найти большой красный круг. Чтобы прийти к ответу, он делает небольшую цепь рассуждений: находит все большие фигуры; затем — все большие фигуры красного цвета; и, наконец, замечает большой красный круг. Размышляя, мы познаем мир. То же самое делают нейронные сети.

Группа исследователей из MIT Lincoln Laboratory Group разработала нейронную сеть, которая составляет цепочки рассуждений, подобные человеческим, чтобы ответить на вопросы о содержании изображений. Модель, названная «Сеть со встроенной прозрачностью» (Transparency by Design Network, TbD-net), визуализирует свой поэтапный мыслительный процесс решения проблем. Это позволяет аналитикам интерпретировать процесс принятия решений. Модель работает лучше, чем другие нейронные сети с визуальным обоснованием (visual-reasoning neural networks).

Понимание того, как нейронная сеть принимает свои решения, является давней проблемой для исследователей искусственного интеллекта (ИИ). Если опираться на само название, то нейронные сети — это системы, вдохновленные моделью человеческого мозга и предназначенные для того, чтобы воспроизводить процесс обучения, похожий на человеческий. Они состоят из входного и выходного слоев и промежуточных слоев, которые преобразуют исходные данные в конечный результат.

Глубокие нейронные сети стали настолько сложными, что практически невозможно проследить этот процесс преобразования данных. Поэтому, такие системы иногда упоминаются как «черные ящики» — происходящие внутри процессы порой озадачивает даже инженеров, которые создают такие системы.

С помощью TbD-net разработчики стремятся сделать эти внутренние процессы прозрачными и ясными. Понимание работы позволяет людям грамотно интерпретировать результаты ИИ. Например, важно знать, что именно нейронная сеть, используемая в беспилотных автомобилях, считает разницей между пешеходом и стоп-сигналом, или на каком этапе рассуждений она видит эту разницу. Подобные идеи позволяют исследователям научить нейронную сеть исправлять любые неверные предположения. Тем не менее разработчики TbD-сети считают, что лучшим нейронным сетям сегодня не хватает эффективного механизма, позволяющего людям понять их процесс мышления.

«Прогресс в улучшении производительности визуальных рассуждений достигается ценой интерпретируемости», — говорит Райан Сокласки, который создал сеть TbD-net с коллегами-исследователями Арджуном Маджумдаром, Дэвидом Машаркой и Филиппом Траном.

Лаборатория Линкольна в MIT смогла сократить разрыв между производительностью и интерпретируемостью с помощью TbD-сети. Одним из ключевых механизмов в системе является набор «модулей», небольших нейронных сетей, которые специализируются на выполнении определенных подзадач. Когда TbD-net задают визуальный вопрос об изображении, она разбивает вопрос на подзадачи и назначает соответствующий модуль для выполнения своей части. Такая техника «разделение целого на части» используется и в автоматической обработке естественного языка (Natural Language Processing), и в области компьютерного зрения при интерпретации образов.

Вывод каждого модуля визуально изображен в том, что группа называет «маской внимания». Маска внимания выделяет тот объект на изображении, который модуль идентифицирует как ответ. Такие визуализации позволяют аналитикам увидеть, как именно модуль интерпретирует изображение.

Слева — фото, справа — маска внимания для металлических объектов на фото. В центре — совмещение двух картинок.

После тестирования TbD-net достигла результатов, превосходящих самые эффективные модели визуального мышления. Исследователи оценили модель, используя визуальный набор данных для ответов на вопросы, состоящий из 70 000 обучающих изображений и 700 000 вопросов, а также наборов для тестирования и проверки из 15 000 изображений и 150 000 вопросов. Благодаря прозрачности, первоначальная модель достигла впечатляюще высокий результат — 98,7% точности при тестировании на наборе данных.

Перевела Евгения Заковоротная

Подробнее о нейросети TbD-net можно почитать в статье «Transparency by Design: Closing the Gap Between Performance and Interpretability in Visual Reasoning». Исследование было представлено на конференции по компьютерному зрению и распознаванию образов (CVPR) этим летом.

Телеграм: t.me/ainewsline

Источник: news.mit.edu



		«Черный ящик» нейросетей приоткрылся
МЕНЮ Главная страница Поиск Регистрация на сайте Помощь проекту Архив новостей ТЕМЫ Новости ИИ Голосовой помощник Городские сумасшедшие ИИ в медицине ИИ проекты Искусственные нейросети Искусственный интеллект Слежка за людьми Угроза ИИ Разработка ИИ Атаки на ИИ ИИ теория Компьютерные науки Машинное обуч. (Ошибки) Машинное обучение Машинный перевод Нейронные сети начинающим Психология ИИ Реализация ИИ Реализация нейросетей Создание беспилотных авто Трезво про ИИ Философия ИИ Внедрение ИИ Big data Генетические алгоритмы Капсульные нейросети Основы нейронных сетей Промпты. Генеративные запросы Распознавание лиц Распознавание образов Распознавание речи Творчество ИИ Техническое зрение Чат-боты Работа разума и сознание Изучение сна Изучение сознания Нейроинтерфейс Психология Работа мозга Работа памяти Работа разума Модель мозга Модель мозга Робототехника, БПЛА Беспилотные автомобили БПЛА Робототехника Трансгуманизм Трансгуманизм Обработка текста Анализ социальных сетей Компьютерная лингвистика Лингвистика Поисковые алгоритмы Теория эволюции Головной мозг Нейронные сети Поведение животных Теория эволюции Дополненная реальность Виртулаьная реальность Дополненная реальность Железо Интернет вещей Квантовый компьютер Нейронные процессоры облачные вычисления Суперкомпьютеры Киберугрозы Кибербезопасность Научный мир Методы исследования Наука и образование Семинары ИТ индустрия ИТ-гиганты Новости ит Разработка ПО Разработка ПО Теория алгоритмов Теория информации Кластеризация Математика Актуальная математика Статистика Теория вероятности Теория информации Теория хаоса Цифровая экономика Технология блокчейн Цифровая экономика Авторизация RSS RSS новости		2019-03-07 20:30 системы технического зрения, ИИ теория Давайте представим ситуацию: маленькому ребенку преподносят картинку с различными фигурами и просят найти большой красный круг. Чтобы прийти к ответу, он делает небольшую цепь рассуждений: находит все большие фигуры; затем — все большие фигуры красного цвета; и, наконец, замечает большой красный круг. Размышляя, мы познаем мир. То же самое делают нейронные сети. Группа исследователей из MIT Lincoln Laboratory Group разработала нейронную сеть, которая составляет цепочки рассуждений, подобные человеческим, чтобы ответить на вопросы о содержании изображений. Модель, названная «Сеть со встроенной прозрачностью» (Transparency by Design Network, TbD-net), визуализирует свой поэтапный мыслительный процесс решения проблем. Это позволяет аналитикам интерпретировать процесс принятия решений. Модель работает лучше, чем другие нейронные сети с визуальным обоснованием (visual-reasoning neural networks). Понимание того, как нейронная сеть принимает свои решения, является давней проблемой для исследователей искусственного интеллекта (ИИ). Если опираться на само название, то нейронные сети — это системы, вдохновленные моделью человеческого мозга и предназначенные для того, чтобы воспроизводить процесс обучения, похожий на человеческий. Они состоят из входного и выходного слоев и промежуточных слоев, которые преобразуют исходные данные в конечный результат. Глубокие нейронные сети стали настолько сложными, что практически невозможно проследить этот процесс преобразования данных. Поэтому, такие системы иногда упоминаются как «черные ящики» — происходящие внутри процессы порой озадачивает даже инженеров, которые создают такие системы. С помощью TbD-net разработчики стремятся сделать эти внутренние процессы прозрачными и ясными. Понимание работы позволяет людям грамотно интерпретировать результаты ИИ. Например, важно знать, что именно нейронная сеть, используемая в беспилотных автомобилях, считает разницей между пешеходом и стоп-сигналом, или на каком этапе рассуждений она видит эту разницу. Подобные идеи позволяют исследователям научить нейронную сеть исправлять любые неверные предположения. Тем не менее разработчики TbD-сети считают, что лучшим нейронным сетям сегодня не хватает эффективного механизма, позволяющего людям понять их процесс мышления. «Прогресс в улучшении производительности визуальных рассуждений достигается ценой интерпретируемости», — говорит Райан Сокласки, который создал сеть TbD-net с коллегами-исследователями Арджуном Маджумдаром, Дэвидом Машаркой и Филиппом Траном. Лаборатория Линкольна в MIT смогла сократить разрыв между производительностью и интерпретируемостью с помощью TbD-сети. Одним из ключевых механизмов в системе является набор «модулей», небольших нейронных сетей, которые специализируются на выполнении определенных подзадач. Когда TbD-net задают визуальный вопрос об изображении, она разбивает вопрос на подзадачи и назначает соответствующий модуль для выполнения своей части. Такая техника «разделение целого на части» используется и в автоматической обработке естественного языка (Natural Language Processing), и в области компьютерного зрения при интерпретации образов. Вывод каждого модуля визуально изображен в том, что группа называет «маской внимания». Маска внимания выделяет тот объект на изображении, который модуль идентифицирует как ответ. Такие визуализации позволяют аналитикам увидеть, как именно модуль интерпретирует изображение. Слева — фото, справа — маска внимания для металлических объектов на фото. В центре — совмещение двух картинок. После тестирования TbD-net достигла результатов, превосходящих самые эффективные модели визуального мышления. Исследователи оценили модель, используя визуальный набор данных для ответов на вопросы, состоящий из 70 000 обучающих изображений и 700 000 вопросов, а также наборов для тестирования и проверки из 15 000 изображений и 150 000 вопросов. Благодаря прозрачности, первоначальная модель достигла впечатляюще высокий результат — 98,7% точности при тестировании на наборе данных. Перевела Евгения Заковоротная Подробнее о нейросети TbD-net можно почитать в статье «Transparency by Design: Closing the Gap Between Performance and Interpretability in Visual Reasoning». Исследование было представлено на конференции по компьютерному зрению и распознаванию образов (CVPR) этим летом. Телеграм: t.me/ainewsline Источник: news.mit.edu Комментарии:

«Черный ящик» нейросетей приоткрылся

Комментарии: