В России случайно создали универсальную нейросеть для улучшения "зрения" беспилотников

МЕНЮ


Главная страница
Поиск
Регистрация на сайте
Помощь проекту
Архив новостей

ТЕМЫ


Новости ИИРазработка ИИВнедрение ИИРабота разума и сознаниеМодель мозгаРобототехника, БПЛАТрансгуманизмОбработка текстаТеория эволюцииДополненная реальностьЖелезоКиберугрозыНаучный мирИТ индустрияРазработка ПОТеория информацииМатематикаЦифровая экономика

Авторизация



RSS


RSS новости


Первоначально разработчики планировали создать приложение для распознавания документов

ТАСС, 12 февраля. Разрабатывая приложение для распознавания документов с помощью смартфонов, российские математики и программисты создали универсальную нейросеть, которая может улучшить системы компьютерного зрения на беспилотниках. Об этом пишет пресс-служба компании Smart Engines.

"Если говорить простым языком, в новую архитектуру в виде математических ограничений заложены законы перспективы. Этот новый подход ведет к интуитивному пониманию нейросетью геометрических законов физического трехмерного мира, законов перспективы и динамики изменения изображения сцены при движении", - пишет пресс-служба.

За последние годы ученые разработали десятки нейросетей, которые могут распознавать препятствия и вычислять оптимальную траекторию движения для автономных автомобилей, беспилотников и прочих приборов и устройств, которым нужно "видеть" окружающий мир и разбивать его на разные категории.

К примеру, подобные системы сейчас активно применяют для автоматического распознавания документов, при подсчете посетителей в ресторанах или проверки качества изготовления различных деталей на заводах. Как правило, каждая подобная система приспособлена для решения конкретной задачи, из-за чего они достаточно плохо справляются с другими проблемами, не похожими на исходную.

Коллектив российских ученых под руководством Дмитрия Николаева и Владимира Арлазарова, сотрудников Института проблем передачи информации РАН и ФИЦ "Информатика и управление" РАН, случайно создали универсальную нейросеть, которая умеет одинаково хорошо решать все эти задачи. Первоначально исследователи разрабатывали приложение для распознавания документов.

"Глаза" нейросети

Как отмечают исследователи, главная сложность при создании подобной программы заключается в том, что ее пользователи фотографируют документы не идеально ровно, а под некоторым углом. В результате этого алгоритм или человек видит не плоскую картинку, а трехмерное изображение с некоторой перспективой.

Для последних это обычно не представляет проблемы. Однако для того, чтобы создать системы искусственного интеллекта, которые смогли бы решить эту обыденную задачу, обычно нужно включить несколько десятков или даже сотни дополнительных слоев нейронов. Это значительно повышает энергетические аппетиты подобных систем, делает их непригодными для автономной работы на мобильных устройствах и не позволяет создавать универсальные нейросети.

Арлазаров, Николаев и их коллеги решили эту проблему, используя несколько новых математических принципов, в том числе так называемое "преобразование Хафа". Первую версию этого алгоритма еще в середине прошлого века создал американский математик Поль Хаф для анализа данных из пузырьковых детекторов частиц.

Этот набор формул позволяет искать прямые линии и определенные типы геометрических фигур на изображении с камеры смартфона или беспилотника. Встроив его в один из слоев нейросети, российские ученые получили универсальную систему, которая одинаково хорошо подходит для решения всех важнейших задач, которые связаны с компьютерным зрением. Как показали первые проверки, нейросеть оказалась примерно в сто раз более эффективной, чем классическая система U-net.

По словам исследователей, этот алгоритм можно применять не только для распознавания документов или улучшения работы автопилотов дронов и автомобилей, но и для анализа медицинских фотографий с томографов, а также в других областях науки и техники, где компьютерное зрение пока не применяется.


Источник: nauka.tass.ru

Комментарии: