Пока вы смотрели на картинку, ваш мозг проводил сразу две операции: а) распознавание контура лица и б) анализ, что за эмоция на нем отражена

МЕНЮ


Искусственный интеллект
Поиск
Регистрация на сайте
Помощь проекту

ТЕМЫ


Новости ИИРазработка ИИВнедрение ИИРабота разума и сознаниеМодель мозгаРобототехника, БПЛАТрансгуманизмОбработка текстаТеория эволюцииДополненная реальностьЖелезоКиберугрозыНаучный мирИТ индустрияРазработка ПОТеория информацииМатематикаЦифровая экономика

Авторизация



RSS


RSS новости


Пока вы смотрели на картинку, ваш мозг проводил сразу две операции: а) распознавание контура лица и б) анализ, что за эмоция на нем отражена.

То, что у человека эти процессы разделяются еще в самом начале тракта распознавания, стало одним из недавних важных открытий в изучении возможностей компьютерного зрения.

Вторым важным открытием стало то, что человек способен распознать, что изображено, даже если картинка совсем размыта или сильно искажена по одной из осей. В этом мы тоже превосходим машины.

Потому что человек больше опирается на образы, а компьютеры, по сути, опираются как раз на алгоритмы размытия и сравнение данных из наиболее подходящих кластеров, уже содержащихся в базе.

Короче — вся суть компьютерного зрения в сравнении чисел с уже имеющимися.

Поэтому для начала машине "скармливают" большую подборку изображений по какому-то предмету. При этом важно, чтобы учебные картинки как содержали искомый предмет, так и не содержали его — компьютеру тоже важно учиться на ошибках.

"Проглатывая" картинки, машина анализирует пиксели и пытается правильно группировать по ним границы важных объектов: например, яркое пятно может быть лицом или Солнцем. Затем все правильно распознанные данные записываются.

А чтобы ускорить процесс сравнения в будущем, наборы информации разбиваются по кластерам: так что, получив очередную картинку, система не полезет шерстить всю БД, а проведет лишь сравнение по тем кластерам, данные в которых наиболее релевантны информации с картинки.

Вот поэтому, например, загрузив фото цветочного поля, среди похожих изображений вы можете обнаружить пестрый бабушкин ковер. Так что поисковики все еще в большей мере опираются на подписи к изображениям.

А вот Facebook, использующий для работы с фото нейронную сеть, научил машину распознавать людей на снимках со спины, использовав для этого 40 000 изображений с Flickr.

Комментарии: