Продолжаем информировать вас о новостях Национального корпуса русского языка

МЕНЮ


Главная страница
Поиск
Регистрация на сайте
Помощь проекту
Архив новостей

ТЕМЫ


Новости ИИРазработка ИИВнедрение ИИРабота разума и сознаниеМодель мозгаРобототехника, БПЛАТрансгуманизмОбработка текстаТеория эволюцииДополненная реальностьЖелезоКиберугрозыНаучный мирИТ индустрияРазработка ПОТеория информацииМатематикаЦифровая экономика

Авторизация



RSS


RSS новости


2025-12-14 11:45

лингвистика

Поэтический корпус пополнен произведениями трех поэтов второй половины ХХ века с особым фокусом на бардовскую поэзию — Владимира Высоцкого, Новеллы Матвеевой и Владимира Уфлянда. Общий объем пополнения — 177 тыс. словоупотреблений или 36 тысяч стихотворных строк.

Тексты, доступные в корпусе ранее, снабжены автоматической нейросетевой морфологической разметкой (лемматизация и грамматика) с частичной ручной коррекцией, исправлено множество ошибок в разметке. По умолчанию эти разборы доступны в поиске наравне с разборами, основанными на грамматическом словаре.

***

В Диалектном корпусе теперь доступны такие инструменты, как «Статистика», «Частотность», частотные словари, n-граммы, поиск с регулярными выражениями, парадигмы в Портрете слова. В частности, можно увидеть в таблице, в каком облике встретились падежные формы слова "заяц" и как коррелирует окончание типа "за ягодам" с разделением говоров на окающие и акающие.

***

В корпусах с автоматической синтаксической разметкой (Основной, Центральные и Региональные СМИ, «От 2 до 15» и Русская классика) теперь можно увидеть синтаксическое дерево предложения. Оно открывается по специальному значку для всех предложений в поисковой выдаче. Для каждого слова в предложении на картинке указана лемма и часть речи, а синтаксические связи между ними отображены в виде направленных стрелок с названием связи. Изображение дерева можно скачать в виде картинки.

***

О каждом нововведении команда Корпуса подробно рассказывает в своем телеграм-канале (t.me/ruscorpora). Там же можно увидеть небольшие видеофрагменты, поясняющие работу нового функционала


Источник: vk.com

Комментарии: