СРЕДСТВА ПОИСКА И ПРЕДСТАВЛЕНИЯ ЛИНГВИСТИЧЕСКИХ ДАННЫХ

МЕНЮ


Главная страница
Поиск
Регистрация на сайте
Помощь проекту
Архив новостей

ТЕМЫ


Новости ИИРазработка ИИВнедрение ИИРабота разума и сознаниеМодель мозгаРобототехника, БПЛАТрансгуманизмОбработка текстаТеория эволюцииДополненная реальностьЖелезоКиберугрозыНаучный мирИТ индустрияРазработка ПОТеория информацииМатематикаЦифровая экономика

Авторизация



RSS


RSS новости


2022-10-28 10:09

лингвистика

В ЭЛЕКТРОННОМ ИЗДАНИИ КАК ОСНОВА ДЛЯ ИЗУЧЕНИЯ ЛЕКСИКИ И СЕМАНТИКИ ДРЕВНЕРУССКОГО ЯЗЫКА

(на материале «Повести временных лет»)

Р. А. Аникина

Ижевский государственный технический университет, Ижевск, Россия

1. На сегодняшний день при высоком развитии информационных технологий актуальным является создание в сети Интернет электронных коллекций, которые дают возможность хранения, обработки и изучения древнейших и средневековых русских и славянских текстов.

Наличие подобных электронных изданий позволяет разносторонне исследовать древние рукописные памятники.

Но при работе с таким материалом возникает ряд проблем, обусловленных наличием в сети Интернет лишь фотокопий или переводных текстов, что, в свою очередь, не позволяет полноценно исследовать интересующий текст [Баранов 2006].

В настоящее время уже существует большое количество порталов, где пользователь может увидеть рукописи или старопечатные книги, но не имеет возможностей сделать, например, выборку лингвистических единиц.

2. Информационно-аналитическая система «Манускрипт» содержит коллекции древнерусских текстов, а также информацию о разработках в области их электронной публикации и о методах создания полнотекстовых баз данных, содержащих сложные по структуре и составу рукописные памятники (URL: http://manuscripts.ru/).

Обработка материала ведется с помощью пользовательских модулей сайта (модуль выборок и запросов; специализированный редактор Olded; модуль грамматических словарей; морфологический анализатор), что дает не только возможность читать текст в виде, БЛИЗКОМ К ОРИГИНАЛУ, но и возможность быстрой выборки искомого языкового материала.

3. Наше исследование ориентировано на изучение лексических единиц с корнем добр- в тексте «Повести временных лет» (далее – ПВЛ) по Лаврентьевской летописи (далее – ЛЛ).

Источником исследования является электронное издание «Повести временных лет» по ЛЛ, сверенное с факсимильным изданием

ПВЛ и опубликованное на портале «Манускрипт».

Исследуемые единицы были выбраны с помощью запросных форм портала, позволяющих познакомиться с контекстами, указателями и осуществить выборку данных.

Исследованием ПВЛ занимались И. П. Еремин, Д. С. Лихачев, О. В. Творогов, В. В. Колесов, Е. В. Душечкина, Г. Ф. Ковалев, Н. П. Некрасов, Г. А. Хабургаев, А. А. Шахматов и другие ученые [Еремин 1966; Лихачев 1979; Творогов 1981; Творогов 2001; Колесов 2001; Душечкина 1973; Ковалев 1980; Некрасов 1896, 1897; Хабургаев 1979; Шахматов 1940].

Язык ПВЛ интенсивно изучался в отечественной науке XIX века П. А. Лавровским, М. А. Колосовым, Н. П. Некрасовым [Лавровский 1852; Колосов 1872; Некрасов 1896].

Более обстоятельно исследуется лексический состав ПВЛ в монографиях Ф. П. Филина и А. С. Львова в XX веке.

Целью авторов являлся анализ лексики памятника, который послужил основой для решения вопроса о характере и происхождении древнерусского литературного языка [Филин 1949; Львов

1975].

4. Для точного выбора интересующих нас контекстов необходимо правильно, учитывая будущую форму результата, сделать запрос, после выполнения которого электронное издание ПВЛ предоставляет все необходимые для изучения контексты (фрагменты текста) (URL: http://manuscripts.ru/mns/portal. main?p1=12&p_lid=1).

Использование запросной формы оказывается более удобным и быстрым способом поиска материала, чем выборка его вручную по

печатному изданию, где НЕ СОХРАНЕНЫ графико-орфографические особенности текста.

Для нашей работы необходимо было сделать выборку всех контекстов, где употребляются слова с корнем добр-.

Для этого мы должны были:

1) выбрать с помощью запросных форм исследуемый текст;

2) задать в запросной строке искомую форму, в данном случае – основу

добр;

3) поставить в запросной строке после заданной искомой формы знак %, для того чтобы система выдала все возможные формы с данной основой, в том числе и двуосновные образования;

4) выбрать форму результата – текст или указатель;

5) указать диапазон листов;

6) задать поиск контекстов с искомым элементом.

В результате был получен перечень контекстов в виде фрагментов текста с выделением искомого элемента и в виде ссылки на фрагмент, где употреблена искомая единица.

Ссылка связана с одним из указателей.

Так, в количественном указателе дано количество словоформ в тексте (в нашем случае – с корнем добр-);

в прямом и обратном указателях система выдает список форм, расположенных в алфавитном порядке (в обратном указателе это инверсированный порядок) со ссылкой на контекст через адрес словоформы.

При использовании многотекстовой запросной формы система дает возможность выборки сразу по нескольким рукописям, что позволяет выявить специфику употребления интересующих форм в разных текстах.

В этом режиме предоставляется возможность использовать в качестве формы результата не только перечисленные выше перечни, но еще и списочный и табличный указатели.

В последнем материал представлен в виде таблицы, в столбцах которой помещены: список словоформ и их адреса для каждого текста отдельно.

Списочный указатель содержит искомые формы, их количество в анализируемых текстах, аббревиатуры рукописей, адреса контекстов.

Следует отметить, что в зависимости от требований пользователя маска поиска может быть разной – основа, основа + суффикс, приставка + основа, вся форма и др.

Важно правильно сформировать запрос, используя маски: % (процент) – для любого количества любых символов и _ (нижнее подчеркивание) – для любого одного символа.

5. При работе с текстом ПВЛ мы поставили цель выявить специфику функционирования слов с корнем добр- как одного из способов репрезентации представления о добре.

При выявлении значений для исследуемых единиц мы опирались, главным образом, на концепцию В. В. Колесова, в которой раскрывается специфика представления о добре в средневековом сознании [Колесов 2001].

В ходе исследования мы выяснили, что слова с общим корнем добр- в исследуемом памятнике имеют семантику, которая обусловлена, ...

Архаическое (дохристианское, языческое) сознание отражает представление о добре как о земном воплощении всего положительного, отсюда внешние проявления этого добра - то, что можно увидеть (например, внешняя красота), использовать для себя, сделать пригодным (отсюда польза).

Христианство предлагает новое представление о добре как о благе: земное добро – это не только путь к небесному благу. И именно эта идея находит свое отражение в тексте «Повести временных лет».

В заключение следует сказать, что использование таких систем обработки древних текстов позволяет не просто познакомиться с графико-орфографическими особенностями текста, но и осуществить определенные операции при работе с ним для последующего лингвистического анализа материала.

Такие системы позволяют также не только работать с текстом, исследовать его, но и получать всю необходимую информацию о нем.

Современные технологии должны обеспечить доступность текстов современным исследователям в области гуманитарных наук, в том числе в сети Интернет.

ОПЫТ МОДЕЛИРОВАНИЯ ЛЕКСИЧЕСКОЙ СЕМАНТИКИ ДРЕВНЕРУССКОГО ЯЗЫКА

(на материале Цветной триоди XI-XII вв.)

И. М. Некипелова

Ижевский государственный технический университет, Ижевск, Россия

В настоящее время при разработке многофункциональных web-модулей, содержащих транскрипции текстов актуальным является моделирование лексического значения слова и его отношений в области семантики.

В связи с этим творческой группой Удмуртского государственного университета и Ижевского государственного технического университета под руководством В. А. Баранова ведется работа по созданию автоматизированного лексико-семантического анализатора в информационно-аналитической системе «Манускрипт».

Это связано с планами использования системы для проведения лингвистических исследований в области лексики и семантики и разработки лингвистической поисковой системы, позволяющей пользователю иметь точное представление о лексическом значении слова и его семантических связях в языке и текстах древних рукописей, хранящихся в базе данных информационно-аналитической системы

«Манускрипт» (URL: http://manuscripts.ru/).

Особый интерес вызывают проблемы моделирования семантических, тематических и словообразовательных связей слов древних славянских и исходных древнегреческих текстов, поиск соответствий, хранение семантических связей в базах данных и их использование.

Типы лексического описания являются основой моделирования лексических значений и семантики слова в базах данных.

Следует также оговорить, что «все типы значений понимаются как дополнительные друг к другу, т.е. как части (стороны, аспекты) целого» [Никитин 1996: 51].

Это является значимым, поскольку при описании семантики слова в его истории необходимо учитывать некоторые факты, затрудняющие исследование.

Во-первых, слово (то есть его словоформы) дошло до современности лишь в определенном контексте/контекстах, что затрудняет фиксирование всех возможных употреблений слова и его связей и отношений с другими языковыми единицами, поскольку

сохранившиеся тексты могут не отражать все отношения слова, которые реализовывались в тот или иной период развития языка.

Следовательно, велика вероятность того, что в поле зрения исследователя находится не все семантическое поле.

Таким образом, в результате лексико-семантического анализа функционирования слова в том или ином контексте можно фиксировать лишь определенные семантические связи слова, и только в исключительных случаях можно гипотетически предполагать существование еще каких-либо элементов, связывающих некоторые языковые явления, поскольку по отношению к тому периоду существования языка нет полной достоверной информации обо всех связях и характеристиках слова, нет полного списка значений слов, формул, устойчивых выражений и т. п.

Восстановлением этих связей занимаются многие ученые, и

не всегда их мнения совпадают при интерпретации древнего текста.

Во-вторых, при интерпретации связей слов, употребленных в древних текстах, не всегда можно говорить об абсолютной адекватности подобного анализа, так как описание семантики слова рассматривается сквозь призму наличия семантических связей слова в современном языке, которых могло и не быть у данной лексемы на более ранних этапах развития языка.

Основную сложность изучения древнерусских текстов сформулировал В. А. Баранов: «К сожалению, до сих пор мы не всегда можем быть уверены в том, что наше понимание и интерпретация древнерусских текстов с точки зрения синтагматических связей, грамматического состава и семантики адекватны пониманию текста древними

книжниками» [Баранов 2003: 16].

Особую сложность представляет исследование семантики текстов, поскольку «...система русского языка еще только формируется и как в частностях, так и в целом представляет иную, во многом отличающуюся от современной, систему» [там же].

В настоящее время разрабатываются правила описания типов значения каждого слова [Некипелова 2006: 298-303; Некипелова 2006: 140-147].

Моделирование семантики представляет собой разработку типовой структуры семантического описания, а наполняемость этой структуры обусловлена индивидуальными характеристиками и отношениями слов.

В качестве примера моделирования семантики слова нами было выбрано слово djlf (в исходном, совпадающем с этимологическим значении), так как оно в истории языка реализовало большое количество семантических отношений и связей.

Моделирование семантики слова djlf представлено на материале текста Триоди цветной, XI-XII в. и XIII в. (лл.1-3) (РГАДА, ф. 381 (Син.

тип.)), №138, 173 л.

В дальнейшем планируется привлечение материала других

списков триодей, содержащихся в базе данных ИАС «Манускрипт», а также списков триодей, ГОТОВЯЩИХСЯ К ПУБЛИКАЦИИ.

Нами разработана структура описания значения слова, которая представлена в виде таблицы (см. Приложение), отражающей иерархические связи слов.

Представленная в таблице структура семантического описания слова требует некоторых комментариев. ...

Основными категориями лингвистической типологии значений являются значения грамматические, номинативные и коммуникативные, а также синтаксические, морфологические и словообразовательные (как разновидности грамматических значений), лексические, фразеологические, словосочетательные (как разновидности номинативных значений).

В основе различий лингвистических типов значения лежат различия в стратификационной природе языковых единиц. ...

При энциклопедическом и этимологическом толковании не даются примеры – цитаты из Триоди, поскольку они отражают первоначальные отношения слова. ...

Как известно, процесс фразеологизации имеет длительную историю, и те устойчивые словосочетания и выражения, которые встречаются в тестах памятников письменности XI-XIV веков,

фразеологизмами еще не являются.

В основном в этот период ученые фиксируют функционирование речевых формул.

Вполне естественно, что эти поля («Фразеологизмы» и «Речевые формулы») не только не совпадают, но и практически не имеют никаких общих данных. ...

Все остальные значения так называемого многозначного слова, данные в Словаре русского языка XI-XVII вв., помещены нами в поле «Омонимическое значение». ...

Значения, не зафиксированные в словарях, представлены нами в поле «Контекстное значение» как значения самостоятельных лексических единиц с теми семантическими характеристиками, которые они имеют непосредственно в приведенном контексте.

При толковании слова важным является определение контекстных значений слова.

Нами разработаны три основных критерия разграничения языкового и

контекстного значений, последовательное применение которых к описанию функционирования слова наиболее точно позволяет выявить языковой или контекстный характер значения слова. ...

Не для каждого слова будут актуальны все типы значений.

Все знаменательные слова потенциально обладают всеми представленными характеристиками, признаками и связями, однако лишь немногие слова максимально их реализуют. ...


Источник: manuscripts.ru

Комментарии: