В MIT создали нейросеть TRN, которая угадывает действия с объектами

МЕНЮ


Искусственный интеллект. Новости
Поиск
Регистрация на сайте
Сбор средств на аренду сервера для ai-news

ТЕМЫ


Новости ИИРазработка ИИВнедрение ИИРабота разума и сознаниеМодель мозгаРобототехника, БПЛАТрансгуманизмОбработка текстаТеория эволюцииДополненная реальностьЖелезоКиберугрозыНаучный мирИТ индустрияРазработка ПОТеория информацииМатематика

Авторизация



RSS


RSS новости

Новостная лента форума ailab.ru


Сотрудники лаборатории искусственного интеллекта MIT рассказали о результатах тестирования Temporal Relation Network (TRN). Эта нейросеть изучает видеоролики и определяет, что происходит с объектами на записи с течением времени. Более того, система научилась прогнозировать некоторые события, узнав не само действие, а намерение его совершить.

Принцип работы Temporal Relation Network

Обрабатывая видеозапись, TRN не анализирует каждый кадр, а выделяет базовые планы и группирует их в кластеры. После этого содержимое полученных кластеров проверяется на соответствие известным системе видам манипуляций. Учёным удалось добиться 95 % точности работы искусственного интеллекта. Temporal Relation Network смогла даже предугадывать события, например, обозначая действие как «собирается открыть книгу». Кроме того, если верить разработчикам, по балансу между точностью и производительностью их нейросеть превосходит известные аналоги.

Базовая структура разработки — свёрточная нейронная сеть, стандартное решение для систем распознавания образов. Для обучения создатели Temporal Relation Network использовали три датасета: самый крупный, Jester, содержащий 150 000 видео и 27 движений руками, а также подборки категоризированного видео TwentyBN’s Something-Something и Carnegie Mellon University’s Charades.

Планы развития

Созданная в MIT сеть распознаёт манипуляции, но не сами объекты. Разработчики собираются устранить этот недостаток в будущем. Кроме того, запланирована реализация концепции, названной «интуитивная физика». Как заявляют сотрудники института, это означает, что для объектов на видео ИИ будет определять физические свойства.

Нейронные сети обучают распознавать действия людей во благо обществу. В июне 2018 года учёные из Индии и Великобритании разработали ИИ, который обнаруживает насильственные действия в толпе. Он распознает удары, пинки, стрельбу, поножовщину, удушения и передает видео в режиме реального времени по мобильной связи.


Источник: tproger.ru

Комментарии: