Что почитать о языке: 5 книг от простого к сложному.

МЕНЮ


Искусственный интеллект
Поиск
Регистрация на сайте
Помощь проекту

ТЕМЫ


Новости ИИРазработка ИИВнедрение ИИРабота разума и сознаниеМодель мозгаРобототехника, БПЛАТрансгуманизмОбработка текстаТеория эволюцииДополненная реальностьЖелезоКиберугрозыНаучный мирИТ индустрияРазработка ПОТеория информацииМатематикаЦифровая экономика

Авторизация



RSS


RSS новости


2020-06-09 14:30

лингвистика

Гастон Доррен - "Лингво: языковой пейзаж Европы"

Книга Гастона Доррена — это необременительная прогулка по языковому разнообразию Европы. Строгие учёные, может быть, придерутся к тому, как автор собирает вишенки с тортов и, кажется, даже не подозревает о том, что такое систематическое изложение. Но главная задача книги — предложить читателю полюбить языки. И это задание она блестяще выполняет. Для каждого языка автор выбирает какую-нибудь особенность (интересная история, яркий человек, стоявший у истоков литературного языка, и так далее) и рассказывает об этой особенности тоном заинтересованного любителя, который всякий раз немножко удивляется: «Надо же, в каких-то языках бывают падежи? Надо же, они ещё и пишут не латиницей?» А в конце разговора про каждый язык автор радует читателя словами, которые были из этого языка заимствованы в английский, и просто какими-нибудь занятными словами этого языка:

Финский экспортировал в английский только одно слово, но какое удачное – sauna!

Giratutona — буквально переводится как шеевёрт: человек, который всегда держит нос по ветру. В 2004 г. специальное жюри признало giratutona самым красивым романшским словом.

Владимир Плунгян - "Почему языки такие разные".

В отличие от Гастона Доррена, Владимир Плунгян не пытается изобразить наивное удивление. Хотя восхищение языковым разнообразием мира проявляется и в его книге. В принципе, эта книга могла бы служить университетским учебником для 1-го курса, но она так увлекательно написана, что даже стесняешься давать её студентам: ведь серьёзная наука якобы должна быть немного непонятной.

Автор рассказывает, как изменяются языки, что такое родство языков и насколько по-разному может быть устроена грамматика. Плунгян — известный специалист в области грамматической семантики. То есть он изучает, как смыслы выражаются в грамматике языков мира. Неудивительно, что особенно подробно в книге описана именно эта область. Например, про глагольное время автор сообщает, что язык не обязан различать прошедшее, настоящее и будущее. Может быть только прошедшее и непрошедшее (так устроены японский и финский), а может быть, наоборот, гораздо больше времен: отдельные времена для событий, произошедших только что, несколько дней назад, около месяца назад и очень давно (так устроены некоторые языки банту в Африке).

До разговора о языках Европы, как у Доррена, Плунгян тоже доберётся; но это произойдёт в самой последней главе книге, и после всего прочитанного читатель поймёт, что языков в лучше всего знакомой ему части света и правда «ничтожно мало по сравнению с остальными континентами».

Светлана Бурлак - "Происхождение языка".

Эта книга посвящена теме, о которой в приличном лингвистическом обществе раньше было говорить не принято. Широко известно, что в 1866 году в статуте только что основанного Парижского лингвистического общества вторым же пунктом было сказано, что работы о происхождении языка (равно как и об изобретении универсального мирового языка) не принимаются к рассмотрению — и это не случайно, поскольку долгое время эта тема была поводом для самых буйных фантазий, выходящих далеко за пределы науки. Но в последние годы вопрос о происхождении языка вернулся в научное русло — в частности, благодаря тому, что лингвистика стала активно взаимодействовать с другими науками: с физиологией, генетикой, археологией и так далее.

Светлана Бурлак открывает свою книгу главой, в которой обсуждает, что такое вообще человеческий язык — ведь для того, чтобы говорить о происхождении языка, стоит понять, что же собственно произошло. «С моей точки зрения, ключевым моментом возникновения языка является превращение коммуникативной системы в достраиваемую: именно с этого момента количество знаков становится потенциально бесконечным и позволяет коммуникативной системе обзавестись всеми теми характеристиками, которые и составляют уникальность человеческого языка», — говорит Бурлак. Здесь особенно показательны слова «с моей точки зрения»: автор не подаёт своё мнение как догму. Так построена вся книга, в которой Бурлак обстоятельно и беспристрастно излагает современные теории происхождения языка. Правда, из этого следует, что когда вы закроете эту книгу, то не будете знать единственно верный ответ на вопрос, откуда взялся язык, но это и к лучшему.

Стивен Пинкер - "Язык как инстинкт".

Стивен Пинкер — один из самых известных современных американских публичных интеллектуалов. В последние годы он стал всё больше писать про достижения гуманизма и прелести прогресса, но книга «Язык как инстинкт», принёсшая ему популярность, появилась ещё в 1994 году, когда он не выходил так далеко за пределы лингвистики. В этой книге он показывает, что язык — это не школьные правила и запреты, а сложная система, к изучению которой у человека есть врождённая способность (именно из этого исходит так называемая генеративная грамматика, основоположником которой является Ноам Хомский). От того, как вообще человек способен усвоить язык, автор переходит к анализу синтаксических структур и показывает, что предложения устроены иерархическим образом — из частей, которые, в свою очередь, состоят из более простых частей, и так далее (например, как на этой картинке, где нарисована схема предложения The happy boy eats ice-cream ‘Счастливый мальчик ест мороженое’).

Может показаться странным, что у Пинкера всё начинается с синтаксиса, ведь мы привыкли к тому, что учебники языкознания идут по возрастающей: от более мелких единиц (звуков) к более крупным (к словам), и только затем к предложениям. Однако это объясняется тем, что в фокусе внимания генеративной грамматики находятся именно предложения: синтаксис — наиболее интересная для Хомского и его последователей область, поскольку то, как мы можем с использованием ограниченного набора синтаксических структур и правил строить бесконечное множество предложений, и есть главная характеристика человеческого языка.

В конце концов автор добирается и до вопроса о происхождении языка, а ещё одну очень полемическую главу посвящает прескриптивистам. Это те, кто концентрируется на том, чтобы выбрать один вариант из нескольких существующих (например, звони?т, а не зво?нит), и пытаются заставить всех говорить именно так, вместо того чтобы задумываться о том, как же на самом деле устроен язык.

Илья Николаев, Ольга Митренина, Татьяна Ландо (ред.) - "Прикладная и компьютерная лингвистика"

Мы совершенно не удивляемся тому, что Яндекс находит нужные документы по нашему запросу, Google Translate умеет переводить с сотни языков, а голосовые помощники разговаривают с нами так, что их почти не отличить от живых людей. Но за этими достижениями стоит кропотливая работа компьютерных лингвистов, которой они занимаются более полувека. Читатель этой книги, может быть, немного разочаруется, когда поймёт, сколько мелких технических трудностей нужно преодолеть, чтобы у компьютера всё получилось: например, уже из первой главы становится понятно, что даже для того, чтобы просто выделить в тексте части речи, нужен сложный математический аппарат, который всё равно не даёт стопроцентного качества.

Книга делится на две части — «Компоненты» и «Направления». В первой из них рассказывается про технические основы компьютерной лингвистики, а во второй — про решение конкретных задач: что нужно для того, чтобы создать систему машинного перевода, извлечь информацию из текста или разработать чат-бота. Это показывает, что компьютерная лингвистика во многом фокусируется на отдельных небольших проблемах: мы не учим компьютер понимать и использовать язык в целом, а учим делать что-то очень конкретное, выбирая те детали, из которых можно построить механизм для решения той или иной задачи.

Впрочем, по мере развития искусственных нейронных сетей и новых способов представления значения в памяти компьютера ситуация меняется: мы постепенно движемся к тому, чтобы машина всё-таки овладела языком по-настоящему (в поисках подробностей можно ввести в поисковик слова BERT или ELMo и почитать статьи вроде вот этой). Поскольку развитие происходит стремительно, неудивительно, что в книге, которая вышла три года назад, многие новые идеи не отражены: например, нейронным сетям посвящено только две страницы — но это не отменяет того, что это хорошее введение в компьютерную лингвистику.

Комментарии: