В Пермском Политехе повысили точность нейросетей для распознавания изображений

2024-03-06 14:11

теория распознавания образов, машинное обучение новости

Нейронные сети с каждым днем захватывают все больше различных сфер и автоматизируют множество процессов. Одно из популярных направлений — распознавание изображений. Его используют в медицинской диагностике, в автомобильной сфере для распознавания знаков на дороге, для навигации и визуального восприятия окружающей среды в робототехнике, для обнаружения инцидентов в системах видеонаблюдения. Требуется постоянная модификация и улучшение методов для снижения ошибок. Ученые ПНИПУ разработали подсистему машинного зрения, которая обеспечивает надежное распознавание мелких и разноудаленных от камеры объектов. Предложенная схема поможет, например, обнаружить оружие или опасные предметы в толпе.

Машинное зрение – это способность компьютеров «видеть» и понимать изображения так же, как это делают люди. С его помощью компьютер распознает лица на фотографиях и определяет типы объектов (например, машина, дерево, человек). Для решения задач обнаружения и идентификации используют нейронные сети. Но они могут выдавать ошибки, что отрицательно сказываются на точности всей системы.

У традиционной одноступенной схемы есть недостатки – игнорирование контекста при поиске объектов и отсутствие жесткой привязки размеров объекта на изображении к параметрам перспективы сцены (кадра). Из-за этого увеличивается количество неверных результатов. Также нейросетевая модель, обученная на универсальном наборе категорий, может неправильно распознавать объекты, если происходит изменение качества или ракурса изображения.

Ученые Пермского Политеха разработали подсистему машинного зрения, которая обеспечивает высокую точность классификации и сегментации. Классификация позволяет определить, к какой категории относится объект, а сегментация – выделить и обозначить его контуры. Политехники предложили двухступенную (двухэтапную) схему обработки изображений независимыми нейронными сетями. Она учитывает контекст сцены и адаптируется к степени удаленности объектов или изменению ракурса съемки.

Основной принцип разработанной политехниками схемы – разделение классов на «суперобъекты» и «вложенные объекты». На первом этапе нейросеть ищет и выделяет область интереса: остается только ограничивающий прямоугольник с суперобъектом («оружие» у «человека», «деталь» — часть «станка»), все остальное обрезается. Таким образом гарантируется, что искомый объект будет находиться внутри области интереса. На втором этапе происходит обнаружение и сегментация искомых объектов.

Такой подход, например, подходит для системы видеонаблюдения с возможностью обнаружения оружия и опасных предметов в толпе, когда люди находятся на разном расстоянии от камер. Обычная нейронная сеть может не различить носимое оружие на очень удаленных или очень приближенных позициях сцены. Но, если предварительно обнаружить силуэты всех людей на снимке, то детекция (распознавание) оружия будет более точной. Другие примеры – идентификация различных разноудаленных конструкций, механизмов со множеством деталей, аэрофотосъемка.

«Мы разработали новую схему обработки изображений с помощью нейронных сетей. Она находит объекты искомых категорий вне зависимости от их размеров, а также стабильна к изменению условий съемки. Увеличение точности на 25 процентов на отдельных тестовых изображениях происходит за счет искусственного ограничения назначения категорий и локализации объектов в контексте сцены обрабатываемого изображения», – поделился кандидат технических наук, доцент кафедры автоматики и телемеханики ПНИПУ Андрей Кокоулин.

Разработка ученых Пермского Политеха улучшит распознавание изображений с помощью нейросетей, повысит точность определения мелких и разноудаленных от камеры объектов. Предложенная схема поможет, например, обнаружить оружие или опасные предметы в толпе.

Источник: naked-science.ru



		В Пермском Политехе повысили точность нейросетей для распознавания изображений
МЕНЮ Главная страница Поиск Регистрация на сайте Помощь проекту Архив новостей ТЕМЫ Новости ИИ Голосовой помощник Городские сумасшедшие ИИ в медицине ИИ проекты Искусственные нейросети Искусственный интеллект Слежка за людьми Угроза ИИ Разработка ИИ ИИ теория Компьютерные науки Машинное обуч. (Ошибки) Машинное обучение Машинный перевод Нейронные сети начинающим Психология ИИ Реализация ИИ Реализация нейросетей Создание беспилотных авто Трезво про ИИ Философия ИИ Внедрение ИИ Big data Генетические алгоритмы Капсульные нейросети Основы нейронных сетей Распознавание лиц Распознавание образов Распознавание речи Творчество ИИ Техническое зрение Чат-боты Работа разума и сознание Изучение сна Изучение сознания Нейроинтерфейс Психология Работа мозга Работа памяти Работа разума Модель мозга Модель мозга Робототехника, БПЛА Беспилотные автомобили БПЛА Робототехника Трансгуманизм Трансгуманизм Обработка текста Анализ социальных сетей Компьютерная лингвистика Лингвистика Поисковые алгоритмы Теория эволюции Головной мозг Нейронные сети Поведение животных Теория эволюции Дополненная реальность Виртулаьная реальность Дополненная реальность Железо Интернет вещей Квантовый компьютер Нейронные процессоры облачные вычисления Суперкомпьютеры Киберугрозы Кибербезопасность Научный мир Методы исследования Наука и образование Семинары ИТ индустрия ИТ-гиганты Новости ит Разработка ПО Разработка ПО Теория алгоритмов Теория информации Кластеризация Математика Актуальная математика Статистика Теория вероятности Теория информации Теория хаоса Цифровая экономика Технология блокчейн Цифровая экономика Авторизация RSS RSS новости		2024-03-06 14:11 теория распознавания образов, машинное обучение новости Нейронные сети с каждым днем захватывают все больше различных сфер и автоматизируют множество процессов. Одно из популярных направлений — распознавание изображений. Его используют в медицинской диагностике, в автомобильной сфере для распознавания знаков на дороге, для навигации и визуального восприятия окружающей среды в робототехнике, для обнаружения инцидентов в системах видеонаблюдения. Требуется постоянная модификация и улучшение методов для снижения ошибок. Ученые ПНИПУ разработали подсистему машинного зрения, которая обеспечивает надежное распознавание мелких и разноудаленных от камеры объектов. Предложенная схема поможет, например, обнаружить оружие или опасные предметы в толпе. Машинное зрение – это способность компьютеров «видеть» и понимать изображения так же, как это делают люди. С его помощью компьютер распознает лица на фотографиях и определяет типы объектов (например, машина, дерево, человек). Для решения задач обнаружения и идентификации используют нейронные сети. Но они могут выдавать ошибки, что отрицательно сказываются на точности всей системы. У традиционной одноступенной схемы есть недостатки – игнорирование контекста при поиске объектов и отсутствие жесткой привязки размеров объекта на изображении к параметрам перспективы сцены (кадра). Из-за этого увеличивается количество неверных результатов. Также нейросетевая модель, обученная на универсальном наборе категорий, может неправильно распознавать объекты, если происходит изменение качества или ракурса изображения. Ученые Пермского Политеха разработали подсистему машинного зрения, которая обеспечивает высокую точность классификации и сегментации. Классификация позволяет определить, к какой категории относится объект, а сегментация – выделить и обозначить его контуры. Политехники предложили двухступенную (двухэтапную) схему обработки изображений независимыми нейронными сетями. Она учитывает контекст сцены и адаптируется к степени удаленности объектов или изменению ракурса съемки. Основной принцип разработанной политехниками схемы – разделение классов на «суперобъекты» и «вложенные объекты». На первом этапе нейросеть ищет и выделяет область интереса: остается только ограничивающий прямоугольник с суперобъектом («оружие» у «человека», «деталь» — часть «станка»), все остальное обрезается. Таким образом гарантируется, что искомый объект будет находиться внутри области интереса. На втором этапе происходит обнаружение и сегментация искомых объектов. Такой подход, например, подходит для системы видеонаблюдения с возможностью обнаружения оружия и опасных предметов в толпе, когда люди находятся на разном расстоянии от камер. Обычная нейронная сеть может не различить носимое оружие на очень удаленных или очень приближенных позициях сцены. Но, если предварительно обнаружить силуэты всех людей на снимке, то детекция (распознавание) оружия будет более точной. Другие примеры – идентификация различных разноудаленных конструкций, механизмов со множеством деталей, аэрофотосъемка. «Мы разработали новую схему обработки изображений с помощью нейронных сетей. Она находит объекты искомых категорий вне зависимости от их размеров, а также стабильна к изменению условий съемки. Увеличение точности на 25 процентов на отдельных тестовых изображениях происходит за счет искусственного ограничения назначения категорий и локализации объектов в контексте сцены обрабатываемого изображения», – поделился кандидат технических наук, доцент кафедры автоматики и телемеханики ПНИПУ Андрей Кокоулин. Разработка ученых Пермского Политеха улучшит распознавание изображений с помощью нейросетей, повысит точность определения мелких и разноудаленных от камеры объектов. Предложенная схема поможет, например, обнаружить оружие или опасные предметы в толпе. Источник: naked-science.ru Комментарии:

В Пермском Политехе повысили точность нейросетей для распознавания изображений

Комментарии: