А. А. Зализняк и компьютерная лингвистика |
||
МЕНЮ Искусственный интеллект Поиск Регистрация на сайте Помощь проекту ТЕМЫ Новости ИИ Искусственный интеллект Разработка ИИГолосовой помощник Городские сумасшедшие ИИ в медицине ИИ проекты Искусственные нейросети Слежка за людьми Угроза ИИ ИИ теория Внедрение ИИКомпьютерные науки Машинное обуч. (Ошибки) Машинное обучение Машинный перевод Реализация ИИ Реализация нейросетей Создание беспилотных авто Трезво про ИИ Философия ИИ Big data Работа разума и сознаниеМодель мозгаРобототехника, БПЛАТрансгуманизмОбработка текстаТеория эволюцииДополненная реальностьЖелезоКиберугрозыНаучный мирИТ индустрияРазработка ПОТеория информацииМатематикаЦифровая экономика
Генетические алгоритмы Капсульные нейросети Основы нейронных сетей Распознавание лиц Распознавание образов Распознавание речи Техническое зрение Чат-боты Авторизация |
2019-06-04 08:00 Речь идёт об информационном поиске, машинном переводе, компьютерных редакторах орфографии, автоматическом реферировании. Например, система машинного перевода включает в себя не только словари на двух языках, но и необходимую морфологическую и синтаксическую информацию о словах, а также алгоритм грамматического анализа. Это нужно для того, чтобы разные формы (руки, рукой, руками и т.д.) воспринимались компьютером как варианты одного слова (рука). Создание компьютерных программ, которые работают с текстами на русском языке, стало возможным благодаря «Грамматическому словарю русского языка», составленному академиком РАН, доктором филологических наук Андреем Анатольевичем Зализняком. Словарь был впервые издан в 1977 году, но с тех пор несколько раз переиздавался с необходимыми изменениями. Он включает в себя примерно 100 тыс. слов с их полной грамматической характеристикой. В основе словаря лежит описание моделей словоизменения, то есть всех вариантов, подвариантов и особых случаев склонения и спряжения в русском языке. Система А. А. Зализняка является комплексной, исчерпывающей и точной. Кроме того, она очень наглядна, благодаря системе индексов, которую использовал лингвист. Описывая именное словоизменение, он обозначал цифрами типы основ, а латинскими буквами – типы ударений. Например, цифре 1 соответствовали слова с основой на твёрдый согласный (комод, олово, твёрдый), цифре 2 – слова с основой на мягкий согласный (тюлень, поле, весенний) и т.д. Буква а обозначала такой тип слов, в которых ударение падает всегда на основу (мама, платёжный); буква d – тип слов, в которых ударение падает на окончание в единственном числе и на основу во множественном числе (заря) и т.д. Обратите внимание: эта система моделей совершенно не похожа на то, как описываются склонения в школьной грамматике! Работы А. А. Зализняка показывают, что, несмотря на свою сложность и многомерность, русский язык (как, впрочем, и любой другой язык) – это стройная система, пусть и не лишённая исключений. Именно чёткое описание этой системы позволяет автоматизировать многие процессы, связанные с анализом и созданием текстов. Конечно, электронные переводчики, спелл-чекеры и другие компьютерные программы, которые решают разные лингвистические задачи, несовершенны. Но они могут быть полезны в определённых ситуациях, и их постепенное усовершенствование – плод сотрудничества программистов и языковедов. Источник: m.vk.com Комментарии: |
|