Шерлок Холмс в мире лингвистики: как открытия Андрея Зализняка перевернули наши представления |
||
МЕНЮ Искусственный интеллект Поиск Регистрация на сайте Помощь проекту ТЕМЫ Новости ИИ Искусственный интеллект Разработка ИИГолосовой помощник Городские сумасшедшие ИИ в медицине ИИ проекты Искусственные нейросети Слежка за людьми Угроза ИИ ИИ теория Внедрение ИИКомпьютерные науки Машинное обуч. (Ошибки) Машинное обучение Машинный перевод Реализация ИИ Реализация нейросетей Создание беспилотных авто Трезво про ИИ Философия ИИ Big data Работа разума и сознаниеМодель мозгаРобототехника, БПЛАТрансгуманизмОбработка текстаТеория эволюцииДополненная реальностьЖелезоКиберугрозыНаучный мирИТ индустрияРазработка ПОТеория информацииМатематикаЦифровая экономика
Генетические алгоритмы Капсульные нейросети Основы нейронных сетей Распознавание лиц Распознавание образов Распознавание речи Техническое зрение Чат-боты Авторизация |
2019-07-22 09:25 «Мы жили в эпоху Зализняка, мы имели счастье быть его современниками» — так ученый мир отреагировал на известие о смерти знаменитого лингвиста, доктора филологических наук Андрея Анатольевича Зализняка. «Такие дела» попросили преподавателя факультета гуманитарных наук ВШЭ, лингвиста Александра Пиперски объяснить суть открытий ученого. Как Зализняк доказал подлинность «Слова о полку Игореве» «Слово о полку Игореве» появилось в русской литературе в лучших традициях детектива: произведение неизвестного автора нашлось в сборнике, который граф Мусин-Пушкин не то получил в дар, не то «присвоил» в монастырских архивах. Спустя двенадцать лет после печати тот самый сборник сгорел во время московского пожара 1812 года. Таинственная история появления и исчезновения «Слова о полку Игореве» оставила ученых спорить, было ли произведение действительно написано в XII веке или являлось лишь талантливой стилизацией под это время? Сторонники той или иной теории защищали свою позицию «до последней капли крови», порой жонглируя одним и тем же аргументом, как отмечал Зализняк в своей работе «»Слово о полку Игореве»: взгляд лингвиста». «Темные места» в рукописи воспринимали то как свидетельство невежества мистификатора, то как нерасшифрованное послание древнерусского автора. Андрей Зализняк вступил в спор с ясной головой, не выступая сторонником ни одной из теорий. «Он сделал очень простую вещь, — объяснил Александр Пиперски. — Он исследовал раннедревнерусские тексты XI–XII веков, которые бесспорно имеют статус древности, и обнаружил в них лингвистические черты, которые просто не могли быть известны фальсификатору в XVIII веке. В живом языке этих лингвистических черт уже не было — они ушли из русского языка, а наука о них еще не знала». Самарское издание «Слова о полку Игореве»Фото: Никитин Николай/ТАССАндрей Зализняк составил целый список таких языковых примет, а некоторые открытия сделал сам. Например, он выяснил, где располагаются в предложении и в каком порядке идут «энклитики» — короткие словечки вроде «мя», «тя», «же», которые примыкают к основному слову. Начяти же ся тои песни по Чтобы подделать такие нюансы, нужно было превосходно знать древнерусский язык и чувствовать его языковые нюансы — но не только! Ведь до графа Мусина-Пушкина дошла не оригинальная рукопись двенадцатого века, а более поздний список с нее, сделанный в XV-XVI веке. Поэтому мистификатору потребовалось бы еще искусственно добавить в стилизованный текст огрехи, допущенные при переписывании текста. «Знать это в XVIII веке было невозможно, — подчеркивает Александр Пиперски. — При этом текст «Слова о полку Игореве» не противоречит нашим знаниям о том, как писали и переписывали в XVI веке. Это показывает с огромной вероятностью, что текст не был подделкой». Андрей Зализняк буквально под микроскопом рассмотрел «Слово о полку Игореве» — изучил не только каждое слово, но и построение фраз, их фонетические особенности. Сумма доказательств весила столько, что спорить с ними стало практически невозможно. При этом сам автор никогда не говорил, что доказал подлинность «Слова о полку Игореве», а скромно использовал более точную формулировку: вероятность того, что произведение является подделкой, исчезающе мала. Как Зализняк разработал описание словоизменения, без которого не было бы поисковиков на русском языке В 1957-58 году Андрей Зализняк был на стажировке в Сорбонне, где среди прочего преподавал русский язык французам. Этот опыт натолкнул его на мысль, что существующих описаний того, как склоняются слова в русском языке, недостаточно. «Иностранцу невозможно было объяснить, как склоняются те или иные русские слова. Вот слово «стол» и слово «дом» оба второго склонения, так написано в учебнике, но дальше что происходит? Оказывается, надо говорить «столУ», но «дОму», и везде разные ударения, но мы привыкли это игнорировать в школьной традиции, — приводит пример Александр Пиперски. — Из этого выросла идея четкого описания всего словоизменения с ударением. Так появился «Грамматический словарь»». В очень упрощенной форме то, что сделал Зализняк, можно объяснить так: любой из нас умеет улыбаться. Если изучать это научно, то окажется, что за улыбку отвечают несколько десятков мышц. И раньше знали только, что люди могут улыбаться, знали, в какой момент нужно улыбнуться и как, но как это все работает, никто толком четко не понимал. Допустим, слово «писать» первого спряжения («пишу», «пишешь», «пишут») и слово «сотрясать» — тоже первого спряжения. Но правильно будет «сотрясаю», «сотрясаешь», «сотрясают», а не «сотряшу», «сотряшешь». Школьный подход не дает нам возможности образовать формы. Если вы знаете только то, чему вас обучили в школе и более ничего — если вы иностранец или компьютерная программа, — вы не можете построить фактически никакую форму правильно. Андрей Зализняк построил четкую систему описаний склонений и спряжений слов русского языка. Теперь, если вы знаете начальную форму слова и тип его склонения, то вы знаете, как правильно использовать его в других формах — например, в именительном падеже множественного числа. Без Зализняка не было бы ни яндекса, ни онлайн-переводчиков «Например, мы вводим в поисковую систему слово «стол». В результатах мы получаем статьи со словами «стола», «столу», «столом» и так далее — и это хорошо, мы хотим, чтобы они тоже находились. Но вот слово «столь» не находится. Почему? Потому что система в поиске ищет не просто похожие сочетания букв, а четко знает, что является формой того или иного слова, а что нет», — рассказал Александр Пиперски. Разработчики могли бы нанять людей, которые бы вручную прописали для программы формы всех слов — как, например, делали с английским языком. Но для русского языка этот процесс вышел бы очень долгим и дорогим, ведь у одного только глагола форм со всеми временами и причастиями получится полсотни. Но оказалось, что вся эта система «архивации» одного слова со всеми его формами уже давно изобретена — Андреем Анатольевичем Зализняком. Как Зализняк расшифровал «неграмотные записки» на берестяных грамотах Берестяные грамоты на территории Великого Новгорода находили еще в конце XIX века, но им не придавали особого значения. Даже археологи и историки русского языка первое время относились к ним несерьезно: подумаешь, какие-то неграмотные записи, которые и прочитать-то нельзя! Зачем изучать эти обрывки, когда есть полноценные книги этой эпохи? Андрей Зализняк сумел разглядеть в этих неграмотных записках логику — и обнаружил, что это на самом деле особая система письма и особая грамматика. Как пояснил Александр Пиперски, все дело в сути этих берестяных грамот. Это маленькие бытовые записки: долговые расписки, жалобы и даже любовные записки: «Если вы возьмете свои сообщения, которыми вы сейчас обмениваетесь в быту, то через сто лет, скорее всего, никто не поймет, что вы имели в виду. Какой-то список покупок, половина еще зачеркнута — ничего не понятно. С записками XII века то же самое». Зализняк сумел понять важность таких текстов, именно как памятников повседневной речи. Да, это не большая церковная книга, которую писал специально обученный человек, но именно памятник живого языка, а это потрясающая редкость. Дальше он обнаружил, что там была особая система письма. То, что на первый взгляд кажется неграмотным письмом, является другой системой использования букв». Новгородская берестяная грамотаФото: Александр Овчинников/ТАСССейчас при письме часто вместо буквы ё пишут букву е, но это не мешает пониманию текста. В древновгородском диалекте такой же взаимозаменяемой парой были твердый знак и буква о — и это только одна из особенностей новгородской бытовой системы письма. Были и грамматические различия: например, именительный падеж мужского рода заканчивался на «е», не Иван, а «Иване». А одна из фонетических особенностей новгородского письма повлияла на современный русский язык. «На месте современного литературного «ц» часто использовалось «к». По-русски «целый», а по-древненовгородски «келе». Например, по стандартам древнерусского языке «в руке» звучит как «в руце», и так оно звучит во всех современных славянских языках, например, в сербском — «у руци». В современном русском языке это не так. Как это можно объяснить? Можно предположить, что это влияние древненовгородского диалекта, где изначально этой формы «в руце» не было, а было «в руке». Это не просто какая-то мелкая региональная разновидность, которая не оставила других следов, кроме как в говоре каких-то деревень. Даже сейчас следы древненовгородского диалекта можно найти в современном литературном языке» — пояснил Пиперски. Автор: Алена Агафонова Источник: takiedela.ru Комментарии: |
|