Лингвистическая экспертиза текста

МЕНЮ


Искусственный интеллект
Поиск
Регистрация на сайте
Помощь проекту

ТЕМЫ


Новости ИИРазработка ИИВнедрение ИИРабота разума и сознаниеМодель мозгаРобототехника, БПЛАТрансгуманизмОбработка текстаТеория эволюцииДополненная реальностьЖелезоКиберугрозыНаучный мирИТ индустрияРазработка ПОТеория информацииМатематикаЦифровая экономика

Авторизация



RSS


RSS новости


2019-04-30 10:00

лингвистика

Лингвист Анатолий Баранов о том, в каких случаях назначается экспертиза текста и как устанавливается авторство

Ответ на вопрос о том, что такое лингвистическая экспертиза, зависит о того, как понимать слово «экспертиза». В широком смысле это любой анализ текста с использованием лингвистических знаний о функционировании языка. Например, можно говорить о лингвистической экспертизе текста для историков, которых интересуют какие-либо данные: время или место создания произведения, авторство. В узком смысле это судебная экспертиза, назначаемая соответствующими инстанциями и используемая как доказательство в судебном процессе. Судебная экспертиза назначается следственными органами или судом. Если речь идет о каком-то исследовании для следственных целей, но оно не назначается официально, а инициируется одной из сторон, например адвокатом, тогда это называется лингвистическим исследованием или заключением специалиста.

Назначение лингвистической экспертизы

Лингвистическая экспертиза в узком смысле может быть назначена в рамках гражданского или уголовного законодательства. Скажем, в гражданском процессе один из наиболее частых типов экспертиз — это экспертиза по делам о защите чести, достоинства и деловой репутации.

Есть большой класс других экспертиз, связанных с уголовным законодательством. В уголовном процессе довольно часто назначаются психолого-лингвистические экспертизы экстремистских текстов, то есть призывов экстремистского характера, и, шире, текстов экстремистского содержания. Причем тексты понимаются в самом широком смысле: собственно вербальные тексты, изображения, а также комбинации вербальной и визуальной информации.

Лингвистическая экспертиза как в широком, так и в узком понимании чрезвычайно разнообразна. С одной стороны, это анализ содержания текста, с другой — чисто формальные методы определения и фиксации речевого сигнала — фоноскопия. При проведении фоноскопических экспертиз лингвист, используя специальные методы и инструменты, исследует речевой сигнал и восстанавливает дословное содержание реплик участников диалога, записанного в результате оперативно-розыскных мероприятий. Это часто называют прослушкой. Фоноскопическая экспертиза часто предполагает также отождествление говорящих, то есть кто произносит ту или иную реплику в разговоре.

В законодательстве о рекламе также есть положения, которые часто оказываются связаны с лингвистической экспертизой. Например, при регистрации товарных знаков возникает проблема сходства регистрируемого знака с уже зарегистрированным обозначением. В этом случае проводится лингвистическая экспертиза факторов сходства и различения товарных знаков. Если регистрируемый товарный знак сходен с уже имеющимся до степени смешения, то он не может быть зарегистрирован. Исследование на сходство товарных знаков проводит лингвист, определяя как формальные характеристики обозначения (используемые гарнитуры, шрифтовые выделения и прочее), так и семантику товарного знака: вербальные компоненты товарного знака, которым можно приписать какую-либо семантику, или, наоборот, компоненты, семантика которых фантазийна, то есть не связана с регулярными единицами лексикона соответствующего языка.

Эксперт-лингвист должен быть высокоэрудированным специалистом в своей профессиональной сфере. Кроме того, он должен быть практикующим ученым, поскольку в основе любой экспертизы лежит научное исследование. Если эксперт-лингвист не владеет соответствующими знаниями — например, не знает, какие типы гарнитур существуют, какие дифференциальные характеристики присущи графемам в данной гарнитуре, какой ореольной семантикой обладают шрифты, — то он не сможет установить факторы сходства и различия сравниваемых наименований. В некоторых областях лингвистической экспертизы требуется привлечение узких специалистов. Скажем, фоноскопию делают специалисты по фонетике и анализу речевого сигнала, экспертизу почерка проводят почерковеды (кстати, в подавляющем большинстве это не лингвисты).

Установление авторства

К сожалению, нет общепринятых методов установления авторства. Это объясняется тем, что нет хорошей теории авторства. Существующие подходы к его установлению применимы с большими ограничениями и имеют разную степень точности, которая определяется конкретной проблемной ситуацией.

Существует, например, комплекс методов, который условно можно назвать лингвостилистическим анализом. Он основывается на постулате, согласно которому у каждого человека есть свой индивидуальный, авторский стиль, проявляющийся в использовании каких-то характерных стилистических средств, слов, фразеологизмов. Лингвостилистический анализ всегда дает вероятностный результат, но в некоторых случаях его использование оправданно. Например, характерные ошибки, специфические идиомы, владение практиками устной и письменной речи часто позволяют установить автора спорного текста с высокой степенью достоверности. При этом гипотеза о том, кто мог написать спорный текст, всегда должна быть предложена извне — грубо говоря, заказчиком соответствующей экспертизы. Потому что лингвист не может, используя такие методы, на большом множестве текстов установить претендентов самостоятельно. Кроме того, в рамках судебной экспертизы лингвист не имеет права сам собирать доказательства по делу.

Другой подход к определению авторства — формальный, или формально-статистический. Он исходит из предпосылки о том, что черты индивидуального стиля автора регулярно проявляются в его речевых произведениях на достаточно большом массиве речевых образцов — текстовых корпусов. Исследуя статистические особенности распределения лексики, синтаксических конструкций эталонного корпуса, заведомо принадлежащего конкретному автору, и количественные характеристики встречаемости слов в спорном тексте и особенности его синтаксиса, эксперт может сделать правдоподобные выводы об авторстве спорного текста.

Формальный подход к установлению авторства позволяет использовать компьютерные программы обработки корпусов, разрабатываемые в корпусной лингвистике. Они основываются на построении словников спорного текста с одной стороны и эталонных текстов претендентов с другой. И тогда по частоте использования тех или иных лексических единиц и синтаксических конструкций можно сформировать модель авторского стиля, представив его, например, в виде вектора в n-мерном пространстве или как визуальный образ. Существующие методы отождествления образов, разрабатываемые в искусственном интеллекте, могут использоваться и для установления авторского стиля.

Гипотеза о том, что индивидуальный стиль проявляется и на уровне лексики, и на уровне стилистики, и на уровне синтаксических конструкций, и на уровне каких-то особенностей оформления текста (если анализируется письменный текст), весьма правдоподобна. Однако неизвестно, какие характеристики возможного варьирования лексики, синтаксиса и оформления текста существенны в данном конкретном случае. Речь человека не остается постоянной в различные периоды его жизни и даже в различных проблемных ситуациях. Одно дело, когда преподаватель читает лекцию в большой аудитории, и другое дело, когда он же покупает продукты в магазине, разговаривает с друзьями или ругается с женой. Во всех этих случаях имеются какие-то специфические факторы речепорождения, которые могут существенно менять частотные характеристики.

Методик установления авторства довольно много, но все они в тех или иных случаях оказываются неудовлетворительными. И если эксперт не критичен к проводимому исследованию и полученным результатам, если он не понимает ограничений выбранного метода, это может привести к ложным выводам. На основе некорректно выполненной экспертизы будет принято правовое решение, по которому пострадают невинные люди. Например, эксперт установил, что предсмертная записка, напечатанная на принтере, не принадлежит погибшему. Тогда есть основания для возбуждения уголовного дела и возможного обвинения каких-то людей, при этом может быть, что на самом деле это действительно предсмертная записка самоубийцы.

Методы и методики лингвистической экспертизы

Стоит сказать, что надежных методов установления по тексту эмоционального состояния человека, скажем состояния аффекта, не существует. Такие заключения делаются в рамках психолого-лингвистической экспертизы. Несколько проще экспертиза, связанная с определением уровня образования автора текста. Есть методики установления пола автора, но в подавляющем количестве случаев они вызывают очень серьезные сомнения. Надо понимать, что методика вторична, а первичны научные методы. И научных методов определения пола пока еще нет, несмотря на многочисленные заявления об обратном. Некоторые специалисты (не могу назвать их учеными) утверждают, что могут гарантированно установить ложность или истинность текста, имея, как они говорят, «уникальную» коллекцию ложных текстов. Однако лингвистическая теория не располагает методами установления ложности или истинности текста. Практически вся художественная литература, вообще говоря, представляет собой грандиозный корпус ложных текстов. Не будем же мы утверждать, что роман Льва Толстого «Война и мир» — это истинный текст в судебном смысле, хотя он сколь угодно может отражать художественную истину, то есть соответствовать художественной фантазии автора.

Конечно, есть серьезные лингвистические теории, которые действительно работают и широко используются при установлении спикеров устных речевых сообщений при анализе записи реплик участников разговоров.

Достаточно эффективен семантический анализ: с помощью специальных семантических метаязыков мы можем определить смысл фразы. Например, установить, есть ли угрозы в речи или нет. Потому что есть семантические компоненты угрозы, они абсолютно формальны, и могут быть выявлены соответствующие фразы, которые передают семантику угрозы.

Есть некоторые методики эвристического характера, которые по необходимости разрабатывались в спецслужбах и правоохранительных органах для того, чтобы по тексту хотя бы приблизительно очертить круг возможных подозреваемых (например, ребенок versus взрослый, образованный versus необразованный и так далее). Такие эвристики основываются на интуиции эксперта. Иногда они работают, особенно в кино и детективной литературе, но в большинстве реальных случаев — нет. И эксперт, который занимается такой деятельностью, должен четко понимать, в каких случаях он может применить ту или иную методику, что реально, а что относится к вымышленному миру телесериалов. Умение отделить реальное от фантазий, то есть наличие здравого смысла, — важнейшая квалификационная характеристика эксперта-лингвиста.


Источник: postnauka.ru

Комментарии: