Новгородские ученые научили нейросеть читать берестяные грамоты |
||
|
МЕНЮ Главная страница Поиск Регистрация на сайте Помощь проекту Архив новостей ТЕМЫ Новости ИИ Голосовой помощник Разработка ИИГородские сумасшедшие ИИ в медицине ИИ проекты Искусственные нейросети Искусственный интеллект Слежка за людьми Угроза ИИ Атаки на ИИ Внедрение ИИИИ теория Компьютерные науки Машинное обуч. (Ошибки) Машинное обучение Машинный перевод Нейронные сети начинающим Психология ИИ Реализация ИИ Реализация нейросетей Создание беспилотных авто Трезво про ИИ Философия ИИ Big data Работа разума и сознаниеМодель мозгаРобототехника, БПЛАТрансгуманизмОбработка текстаТеория эволюцииДополненная реальностьЖелезоКиберугрозыНаучный мирИТ индустрияРазработка ПОТеория информацииМатематикаЦифровая экономика
Генетические алгоритмы Капсульные нейросети Основы нейронных сетей Промпты. Генеративные запросы Распознавание лиц Распознавание образов Распознавание речи Творчество ИИ Техническое зрение Чат-боты Авторизация |
2025-10-12 11:38 Иван Филиппов пояснил, что распознавание букв в целом — задача стандартная для компьютерного зрения, однако древнерусская письменность создает некоторые трудности. Для работы с такими текстами необходимы новые инструменты. В Великом Новгороде обнаружили уже более 1200 берестяных грамот, и их число продолжает расти. Расшифровка каждой грамоты требует большого количества времени и усилий, поскольку одни и те же символы могут читаться по-разному, а устаревшие буквы и редкие знаки намного усложняют автоматическое распознавание. На сегодняшний день готовых автоматизированных решений для этой задачи практически нет. Существующие аналоги грешат либо недостаточной точностью, либо недостаточной стабильностью, либо требуют огромных объемов данных, размеченных вручную. Новая система станет быстрым и удобным инструментом для палеографов, архивистов и исследователей. Для обучения нейросети использовали небольшой, но тщательно отобранный набор данных — пять «эталонных» грамот, на которых все буквы были размечены вручную. При выборе грамот учитывали, чтобы они были целыми, содержали много текста и максимально разнообразные, четко написанные символы. Кроме того, в обучающий набор вошли автоматически вырезанные фрагменты букв, полученные с помощью специального детектора. Процесс работы системы начинается с запуска этого детектора: он находит буквы на изображении и обводит каждую прямоугольной рамкой («боксом»). Поскольку модель не может обработать всю грамоту целиком, буквы сначала распознаются по отдельности, а затем собираются в строки. Далее система выполняет сегментацию, ищет контуры и объединяет близко расположенные рамки, учитывая расстояние между ними и соотношение площадей. Разработчики уже создали приложение, в котором можно загружать фотографии грамот, автоматически находить буквы, распознавать их и экспортировать результат. Система умеет обучаться на новых данных: по мере ее использования база для обучения пополняется качественными примерами. В перспективе этот процесс планируют полностью автоматизировать. По словам Ивана Филиппова, система показывает высокую скорость и надежность: обработка одного изображения занимает всего одну-две секунды. Точность распознавания достигает 98%. Разработка уже готова к внедрению в архивные и научные проекты. Кроме того, она открывает возможности для определения даты создания грамоты и ее авторства. Интересно, что модель, обученная на берестяных грамотах, хорошо справляется и с другими древнерусскими рукописями — а именно с ними связана основная цель проекта, ведь в архивах хранится множество документов, о которых известно очень мало. Автор - Майя Боржемская Источник: www.mk-novgorod.ru Комментарии: |
|