ПРОРЫВНОЙ ОПТИЧЕСКИЙ СЕНСОР, ПОВТОРЯЮЩИЙ ЧЕЛОВЕЧЕСКИЙ ГЛАЗ, МОЖЕТ БЫТЬ КЛЮЧЕВЫМ ШАГОМ К УЛУЧШЕНИЮ ИСКУССТВЕННОГО ИНТЕЛЛЕКТА

МЕНЮ


Искусственный интеллект
Поиск
Регистрация на сайте
Помощь проекту

ТЕМЫ


Новости ИИРазработка ИИВнедрение ИИРабота разума и сознаниеМодель мозгаРобототехника, БПЛАТрансгуманизмОбработка текстаТеория эволюцииДополненная реальностьЖелезоКиберугрозыНаучный мирИТ индустрияРазработка ПОТеория информацииМатематикаЦифровая экономика

Авторизация



RSS


RSS новости


Исследователи из университета штата Орегон (OSU) делают ключевые шаги при помощи нового типа оптического сенсора, который точно повторяет способность человеческого глаза воспринимать изменения в своём поле зрения.

Этот сенсор — большой прорыв в таких областях, как распознавание образов, робототехника и искусственный интеллект. Результаты команды из инженерного колледжа OSU под руководством исследователя Джона Лабрама и аспирантки Синтии Трухильо Херреры опубликованы 8 декабря в журнале Applied Physics Letters.

«Предыдущие попытки создать устройство, напоминающее человеческий глаз, — ретиноморфный сенсор — полагались на программное обеспечение», — сказал Лабрам, доцент электроинженерии и компьютерных наук. Но работа нового сенсора является частью его дизайна на базовом уровне. Он использует ультратонкие слои перовскитовых полупроводников, широко изучающиеся в последние годы из-за их потенциала для солнечной энергетики. Эти полупроводники превращаются из сильных электрических изоляторов в хорошие проводники, если их поместить на свет.

«Можно считать, что отдельный пиксель делает то, что раньше потребовало бы целого микропроцессора», — сказал Лабрам, который ведёт исследование при поддержке National Science Foundation.

По словам Лабрама, новый сенсор мог бы идеально подойти нейроморфным компьютерам, которые будут обеспечивать следующее поколение искусственного интеллекта в таких его приложениях, как беспилотные автомобили, робототехника и продвинутое распознавание образов. В отличие от традиционных компьютеров, которые обрабатывают информацию последовательно как серию инструкций, нейроморфные компьютеры спроектированы подобно сильно распараллеленным нейросетям человеческого мозга.

«Люди пытались воссоздать это на аппаратном уровне, и у них это довольно хорошо получилось, — сказал Лабрам. — Однако даже несмотря на то, что проектируемые алгоритмы и архитектура всё больше и больше напоминают мозг человека, информация, которую эти системы получают, всё ещё решительным образом заточена под традиционные компьютеры».

Другими словами, для полного раскрытия своего потенциала компьютеру, который «думает» скорее, как мозг человека, нужен детектор изображений, который «видит» скорее, как человеческий глаз.

Глаз, поразительно сложный орган, содержит около 100 миллионов фоторецепторов. Однако оптический нерв содержит только 1 миллион связей с мозгом. Это означает, что значительная часть предварительной обработки и динамического сжатия должна проходить в сетчатке перед тем, как изображение может быть передано в мозг.

«Как оказалось, наше зрение особенно хорошо адаптировано к определению движущихся объектов, и сравнительно менее заинтересовано в статичных картинках, — сказал Лабрам. — Поэтому наши оптические „контуры“ отдают приоритет сигналам от фоторецепторов, определяющих изменение в интенсивности света. Вы можете продемонстрировать это сами себе, если упрётесь взглядом в одну точку до тех пор, пока объекты в вашем периферическом зрении не начнут исчезать. Это явление известно как эффект Трокслера.

Традиционные сенсорные технологии, такие как чипы в цифровых камерах и смартфонах, лучше приспособлены к последовательной обработке. Изображения сканируются двумерным массивом сенсоров, пиксель за пикселем, с заданной частотой. Каждый сенсор производит сигнал с амплитудой, которая напрямую зависит от интенсивности света, которое он получает, что означает, что статичное изображение будет давать более-менее постоянное напряжение на выходе из сенсора.

Ретиноморфный сенсор, напротив, остаётся довольно спокойным в статичных условиях. Он регистрирует короткий резкий сигнал, когда чувствует изменение освещённости, а затем быстро возвращается в базовое состояние. Таким поведением он обязан уникальным фотоэлектрическим свойствам класса полупроводников, известных как перовскиты, которые также являются многообещающим материалом для производства дешёвых солнечных панелей нового поколения.

В ретиноморфном сенсоре Лабрама перовскит наносится ультратонкими слоями всего лишь в несколько сотен нанометров, и в целом работает как конденсатор, ёмкость которого меняется при освещении. Конденсатор запасает энергию в электрическом поле.

«Вот как мы это тестируем: мы оставляем его в темноте на секунду, затем выключаем свет и просто оставляем его включённым, — сказал он. — Как только свет включается, мы получаем большой пик напряжения, а затем оно быстро спадает, хотя интенсивность света остаётся постоянной. Это то, чего мы хотим».

Хотя лаборатория Лабрама сейчас может тестировать только один сенсор за раз, его команда испытала некоторое число устройств и выработала математическую модель их поведения, придя к тому, что Лабрам называет хорошим совпадением между теорией и практикой.

Это позволило команде симулировать набор ретиноморфных сенсоров, чтобы предсказать, как такая камера реагировала бы на входящие стимулы.

«Мы можем конвертировать видео в набор интенсивностей света и затем передать это в нашу симуляцию, — сказал Лабрам. — Области, в которых предсказан выход высокого напряжения, загораются, а области с низким напряжением остаются тёмными. Если камера относительно неподвижна, можно чётко видеть, что все движущиеся предметы сильно выделяются. Это довольно хорошо соответствует парадигме зрения млекопитающих».

Симуляция с использованием записи тренировки по бейсболу демонстрирует ожидаемые результаты. Игроки на внутреннем квадрате отображаются как чётко различимые, ярко движущиеся объекты. Относительно неподвижные объекты: сам внутренний квадрат, сиденья на переднем плане, даже игроки на внешнем поле — пропадают в темноте.

Ещё более яркая симуляция показывает птицу, залетающую в поле зрения, а затем почти исчезающую, когда она останавливается у невидимой кормушки. Птица снова появляется, когда улетает. Раскачанная кормушка становится видна, только когда начинает движение.

«Хорошая вещь состоит в том, что с этой симуляцией мы можем внести любое видео в один из этих наборов и обработать эту информацию практически так же, как это делает человеческий глаз, — сказал Лабрам. — Например, можно представить, как эти сенсоры использует робот, отслеживающий движение объектов. Любые статичные вещи в его поле зрения не будут вызывать ответ, тогда как движущиеся объекты будут регистрироваться высоким напряжением. Это немедленно покажет роботу, где находится объект, без необходимости осуществлять сложную обработку изображения».


Источник: aip.scitation.org

Комментарии: