Могут ли оптические нейросети быть точнее цифровых? Наши ученые говорят: «Да!»

МЕНЮ


Главная страница
Поиск
Регистрация на сайте
Помощь проекту
Архив новостей

ТЕМЫ


Новости ИИРазработка ИИВнедрение ИИРабота разума и сознаниеМодель мозгаРобототехника, БПЛАТрансгуманизмОбработка текстаТеория эволюцииДополненная реальностьЖелезоКиберугрозыНаучный мирИТ индустрияРазработка ПОТеория информацииМатематикаЦифровая экономика

Авторизация



Ученые Самарского университета им. Королёва разработали новый подход к созданию оптических трансформеров – нейросетевых блоков, лежащих в основе современных больших ИИ моделей, способных анализировать и классифицировать изображения и человеческую речь и использующих для обработки данных потоки фотонов и наборы оптических компонентов. В отличие от цифровых нейросетей оптические обладают гораздо большей скоростью работы и энергоэффективностью, не требуя наличия мощного электропитания, однако они пока уступают цифровым в точности обработки данных.

Учеными университета предложен новый подход к организации оптического умножения матриц, который, как показали многочисленные эксперименты, позволяет оптическим трансформерам превзойти классические цифровые нейросети по точности работы. Исследование проведено на базе Исследовательского центра в сфере искусственного интеллекта второй волны, созданного в Самарском университете им. Королёва в рамках федерального проекта "Искусственный интеллект". Научная статья с результатами исследования принята к публикации в рамках одной из наиболее престижных международных конференций в области сенсорных систем и интернета вещей – ACM SenSys (ACM Conference on Embedded Networked Sensor Systems), которая пройдет в мае 2026 года во Франции.

"Сейчас основной мировой тренд в разработке оптических нейросетей – это попробовать догнать цифровые нейросети по уровню точности работы. Нам первыми удалось показать, что это реально возможно – догнать и даже перегнать цифровые нейросети, если брать оптические трансформерные модели. Полученный результат – это совместное достижение специалистов по оптике и искусственному интеллекту. Сама по себе схема оптического матричного умножения, использованная нами, достаточно известная, мы ее модифицировали, заменив, где возможно, классические элементы на дифракционные. Но главное – нам удалось по-новому посмотреть на погрешность умножения. При оптическом умножении чем больше размерность матриц – двумерных массивов данных, тем больше получается погрешность. Но нам удалось реализовать численную модель оптического умножения внутри процесса обучения нейросети. И оказалось, что в этом случае нейросеть сама компенсирует погрешность умножения, без ущерба для финальной точности", – рассказал профессор Артем Никоноров, директор Института искусственного интеллекта и руководитель Центра "Интеллектуальная мобильность многофункциональных беспилотных авиационных систем" Самарского университета им. Королёва.

По его словам, оптическое умножение имеет ряд параметров, и эти параметры также оптимизируются в процессе обучения нейросети, что позволяет не просто компенсировать погрешность, а даже улучшить точность по сравнению с цифровым аналогом.

"Похоже, что это работает как некоторая обобщенная, параметризированная версия матричного умножения, которая подстраивается под нашу задачу в процессе обучения трансформера. Получается, так сказать, "персонализация" матричного умножения под конкретную задачу. Более того, в схему оптического трансформера можно внести элемент, отвечающий за дополнительную параметризацию, и тогда точность нейросети вырастает еще больше", – отметил Артем Никоноров.

Выводы ученых были подтверждены в ходе серии экспериментов, проведенных на численной модели модифицированной оптической схемы, встроенной внутрь обычной нейронной сети. В роли "подопытных" в этих экспериментах выступали компактные языковые модели (Tiny LLM) и облегченные архитектуры компьютерного зрения (Tiny ViT), а также нейросетевая модель, отвечающая за оценку кредитоспособности.

"Предложенный нами подход продемонстрировал точность, превосходящую показатели традиционных цифровых трансформерных моделей. Сначала мы подтвердили эффект повышения точности в трех типах задач: обработка текстов, обработка изображений и банковская оценка кредитоспособности. Потом мы решили добавить в схему отдельный обучаемый дифракционный элемент, полностью отвечающий за параметризацию, и его внесение позволило получить дополнительный прирост точности. Этот прирост в разных задачах разный, но он есть. Благодаря этому нам, например, удалось снизить у нашей схемы в полтора раза показатель перплексии, а чем меньше перплексия, тем лучше языковая модель генерирует текст, лучше и точнее подбирает слова", – пояснил Артем Никоноров.

В качестве дополнительного оптического компонента, внесенного в схему трансформера, был использован разработанный в университете миниатюрный дифракционный элемент диаметром несколько миллиметров. Подобные элементы, изготавливаемые из полимерного фоторезиста или кварца, применяются при создании компактных сверхлегких оптических систем для наноспутников. Как подчеркнул ученый, этот компонент, повышающий точность, является полностью пассивным, он не требует никаких энергозатрат, в то время как в цифровых нейросетях для увеличения точности нужно проводить больше вычислений, а значит, увеличивать энергопотребление.

"Высокое энергопотребление огромного количества вычислителей-графических карт – это один из главных сдерживающих факторов в развитии искусственного интеллекта. Использование оптических вычислений – один из восходящих трендов в преодолении этого ограничения. Будущее определённо за оптикой. На основе оптических нейросетей в перспективе можно будет создавать высокопроизводительные и при этом энергоэффективные и компактные системы искусственного интеллекта для самых различных устройств и объектов, например, для беспилотных летательных аппаратов, для робототехнических и автономных систем, интернета вещей", – подытожил Артем Никоноров.

В ближайших планах исследовательской группы – работы по созданию аппаратного прототипа модифицированного оптического трансформера, в том числе пригодного для использования на борту дронов.

Справочно

Самарский университет – один из мировых лидеров в области исследований дифракционных оптических элементов и обработки изображений. Разработанные в университете дифракционные элементы – один из результатов 40-летней работы школы информационной оптики и фотоники под руководством академика РАН, президента Самарского университета Виктора Сойфера. Первая статья ученых Самарского университета, подтверждавшая возможность использования дифракционной оптики в изображающих системах, появилась в мае 2015 года по итогам крупнейшей мировой конференции по обработке изображений IEEE Computer Vision and Pattern Recognition.


Источник: ssau.ru

Комментарии: