Как распознать рукописный текст на русском языке?

2022-07-20 17:50

методы распознавания образов, реализация искусственного интеллекта

Российские исследователи искусственного интеллекта разработали новую свёрточную нейросеть (CNN), способную распознавать изображения рукописных букв русского алфавита с точностью 99%.

ПО способно распознать рукопись, написанную кириллическими знаками. Причем распознавание текста практически не зависит от почерка, что само по себе трудно даже для человека. Приложение, созданное под эту нейросеть, защищено от утечки информации и не требует подключения к Интернету. Следовательно, в перспективе сможет использоваться для обработки конфиденциальных сведений

«С развитием IT-технологий растет важность быстрого и качественного преобразования рукописного текста в цифровую печатную версию, чтобы было удобнее копировать, редактировать или извлекать из него данные. Целью нашего исследования было распознавание рукописного текста на русском языке нейросетью с использованием моделей глубокого обучения. Насколько нам известно, это первая в мире работа такого рода», — отметил соавтор исследования, студент Института информационных и космических технологий СФУ Андрей Левков.

Обучение нейросети проводилось с помощью данных хранилища CoMNIST — это известная база данных, содержащая образцы рукописного написания букв на латинице и кириллице. Сначала ученые построили новый набор данных с помеченным изображением для 33 букв российского алфавита. Затем разработали новую архитектуру CNN для обнаружения рукописных букв российского алфавита и сравнили ее с уже существующими мощными моделями CNN.

После этого представили полное описание сверточной нейросети и исходного кода, чтобы другие исследователи могли проверить результаты на своих примерах. Для написания ПО был выбран язык Python и интерактивная среда разработки Jupyter.

«Набор данных для анализа содержит 13299 фотографий, на которых зафиксированы прописные, печатные и написанные курсивом буквы. Приблизительно на 85% этих снимков нейронная сеть (CNN) училась распознавать буквы русского алфавита, а ещё на 15% шла проверка усвоенных «знаний». Мы сравнили разработанную нашим коллективом модель с наиболее мощными моделями CNN, например, с VGG-16, VGG-19 и другими. Оказалось, что точность нашей модели во время обучения составляла до 99%, всё обучение заняло 3 часа. Точность прогнозирования модели составила до 95,83%», — рассказала руководитель исследования, доцент кафедры систем искусственного интеллекта СФУ Анастасия Сафонова.

В итоге удалось зарегистрировать уникальную программу ЭВМ, правообладателем которой выступает СФУ. В дальнейшем эксперты планируют обучить модель «читать» целые слова и предложения, а также освоить различные стили письма. Разработка выполнена специалистами Сибирского федерального университета (СФУ) и Санкт-Петербургского государственного электротехнического университета «ЛЭТИ».

Скачать код, чтобы обучить модель на своем собственном наборе данных, можно здесь.

Источник: www.it-world.ru



		Как распознать рукописный текст на русском языке?
МЕНЮ Главная страница Поиск Регистрация на сайте Помощь проекту Архив новостей ТЕМЫ Новости ИИ Голосовой помощник Городские сумасшедшие ИИ в медицине ИИ проекты Искусственные нейросети Искусственный интеллект Слежка за людьми Угроза ИИ Разработка ИИ ИИ теория Компьютерные науки Машинное обуч. (Ошибки) Машинное обучение Машинный перевод Нейронные сети начинающим Психология ИИ Реализация ИИ Реализация нейросетей Создание беспилотных авто Трезво про ИИ Философия ИИ Внедрение ИИ Big data Генетические алгоритмы Капсульные нейросети Основы нейронных сетей Распознавание лиц Распознавание образов Распознавание речи Творчество ИИ Техническое зрение Чат-боты Работа разума и сознание Изучение сна Изучение сознания Нейроинтерфейс Психология Работа мозга Работа памяти Работа разума Модель мозга Модель мозга Робототехника, БПЛА Беспилотные автомобили БПЛА Робототехника Трансгуманизм Трансгуманизм Обработка текста Анализ социальных сетей Компьютерная лингвистика Лингвистика Поисковые алгоритмы Теория эволюции Головной мозг Нейронные сети Поведение животных Теория эволюции Дополненная реальность Виртулаьная реальность Дополненная реальность Железо Интернет вещей Квантовый компьютер Нейронные процессоры облачные вычисления Суперкомпьютеры Киберугрозы Кибербезопасность Научный мир Методы исследования Наука и образование Семинары ИТ индустрия ИТ-гиганты Новости ит Разработка ПО Разработка ПО Теория алгоритмов Теория информации Кластеризация Математика Актуальная математика Статистика Теория вероятности Теория информации Теория хаоса Цифровая экономика Технология блокчейн Цифровая экономика Авторизация RSS RSS новости		2022-07-20 17:50 методы распознавания образов, реализация искусственного интеллекта Российские исследователи искусственного интеллекта разработали новую свёрточную нейросеть (CNN), способную распознавать изображения рукописных букв русского алфавита с точностью 99%. ПО способно распознать рукопись, написанную кириллическими знаками. Причем распознавание текста практически не зависит от почерка, что само по себе трудно даже для человека. Приложение, созданное под эту нейросеть, защищено от утечки информации и не требует подключения к Интернету. Следовательно, в перспективе сможет использоваться для обработки конфиденциальных сведений «С развитием IT-технологий растет важность быстрого и качественного преобразования рукописного текста в цифровую печатную версию, чтобы было удобнее копировать, редактировать или извлекать из него данные. Целью нашего исследования было распознавание рукописного текста на русском языке нейросетью с использованием моделей глубокого обучения. Насколько нам известно, это первая в мире работа такого рода», — отметил соавтор исследования, студент Института информационных и космических технологий СФУ Андрей Левков. Обучение нейросети проводилось с помощью данных хранилища CoMNIST — это известная база данных, содержащая образцы рукописного написания букв на латинице и кириллице. Сначала ученые построили новый набор данных с помеченным изображением для 33 букв российского алфавита. Затем разработали новую архитектуру CNN для обнаружения рукописных букв российского алфавита и сравнили ее с уже существующими мощными моделями CNN. После этого представили полное описание сверточной нейросети и исходного кода, чтобы другие исследователи могли проверить результаты на своих примерах. Для написания ПО был выбран язык Python и интерактивная среда разработки Jupyter. «Набор данных для анализа содержит 13299 фотографий, на которых зафиксированы прописные, печатные и написанные курсивом буквы. Приблизительно на 85% этих снимков нейронная сеть (CNN) училась распознавать буквы русского алфавита, а ещё на 15% шла проверка усвоенных «знаний». Мы сравнили разработанную нашим коллективом модель с наиболее мощными моделями CNN, например, с VGG-16, VGG-19 и другими. Оказалось, что точность нашей модели во время обучения составляла до 99%, всё обучение заняло 3 часа. Точность прогнозирования модели составила до 95,83%», — рассказала руководитель исследования, доцент кафедры систем искусственного интеллекта СФУ Анастасия Сафонова. В итоге удалось зарегистрировать уникальную программу ЭВМ, правообладателем которой выступает СФУ. В дальнейшем эксперты планируют обучить модель «читать» целые слова и предложения, а также освоить различные стили письма. Разработка выполнена специалистами Сибирского федерального университета (СФУ) и Санкт-Петербургского государственного электротехнического университета «ЛЭТИ». Скачать код, чтобы обучить модель на своем собственном наборе данных, можно здесь. Источник: www.it-world.ru Комментарии:

Как распознать рукописный текст на русском языке?

Комментарии: