А. А. Зализняк и компьютерная лингвистика

МЕНЮ


Искусственный интеллект
Поиск
Регистрация на сайте
Помощь проекту

ТЕМЫ


Новости ИИРазработка ИИВнедрение ИИРабота разума и сознаниеМодель мозгаРобототехника, БПЛАТрансгуманизмОбработка текстаТеория эволюцииДополненная реальностьЖелезоКиберугрозыНаучный мирИТ индустрияРазработка ПОТеория информацииМатематикаЦифровая экономика

Авторизация



RSS


RSS новости


2019-06-04 08:00

лингвистика

Речь идёт об информационном поиске, машинном переводе, компьютерных редакторах орфографии, автоматическом реферировании. Например, система машинного перевода включает в себя не только словари на двух языках, но и необходимую морфологическую и синтаксическую информацию о словах, а также алгоритм грамматического анализа. Это нужно для того, чтобы разные формы (руки, рукой, руками и т.д.) воспринимались компьютером как варианты одного слова (рука).

Создание компьютерных программ, которые работают с текстами на русском языке, стало возможным благодаря «Грамматическому словарю русского языка», составленному академиком РАН, доктором филологических наук Андреем Анатольевичем Зализняком. Словарь был впервые издан в 1977 году, но с тех пор несколько раз переиздавался с необходимыми изменениями.

Он включает в себя примерно 100 тыс. слов с их полной грамматической характеристикой. В основе словаря лежит описание моделей словоизменения, то есть всех вариантов, подвариантов и особых случаев склонения и спряжения в русском языке. Система А. А. Зализняка является комплексной, исчерпывающей и точной. Кроме того, она очень наглядна, благодаря системе индексов, которую использовал лингвист. Описывая именное словоизменение, он обозначал цифрами типы основ, а латинскими буквами – типы ударений. Например, цифре 1 соответствовали слова с основой на твёрдый согласный (комод, олово, твёрдый), цифре 2 – слова с основой на мягкий согласный (тюлень, поле, весенний) и т.д. Буква а обозначала такой тип слов, в которых ударение падает всегда на основу (мама, платёжный); буква d – тип слов, в которых ударение падает на окончание в единственном числе и на основу во множественном числе (заря) и т.д. Обратите внимание: эта система моделей совершенно не похожа на то, как описываются склонения в школьной грамматике!

Работы А. А. Зализняка показывают, что, несмотря на свою сложность и многомерность, русский язык (как, впрочем, и любой другой язык) – это стройная система, пусть и не лишённая исключений. Именно чёткое описание этой системы позволяет автоматизировать многие процессы, связанные с анализом и созданием текстов. Конечно, электронные переводчики, спелл-чекеры и другие компьютерные программы, которые решают разные лингвистические задачи, несовершенны. Но они могут быть полезны в определённых ситуациях, и их постепенное усовершенствование – плод сотрудничества программистов и языковедов.


Источник: m.vk.com

Комментарии: