Видеоокулография доказала повышенную сложность полисинтетических языков для чтения |
||
МЕНЮ Главная страница Поиск Регистрация на сайте Помощь проекту Архив новостей ТЕМЫ Новости ИИ Голосовой помощник Разработка ИИГородские сумасшедшие ИИ в медицине ИИ проекты Искусственные нейросети Искусственный интеллект Слежка за людьми Угроза ИИ ИИ теория Внедрение ИИКомпьютерные науки Машинное обуч. (Ошибки) Машинное обучение Машинный перевод Нейронные сети начинающим Психология ИИ Реализация ИИ Реализация нейросетей Создание беспилотных авто Трезво про ИИ Философия ИИ Big data Работа разума и сознаниеМодель мозгаРобототехника, БПЛАТрансгуманизмОбработка текстаТеория эволюцииДополненная реальностьЖелезоКиберугрозыНаучный мирИТ индустрияРазработка ПОТеория информацииМатематикаЦифровая экономика
Генетические алгоритмы Капсульные нейросети Основы нейронных сетей Распознавание лиц Распознавание образов Распознавание речи Творчество ИИ Техническое зрение Чат-боты Авторизация |
2024-02-13 12:28 Учёные сравнили движения глаз у билингвов во время чтения на двух языках — русском и адыгейском Сначала коротко Мнение: Считается, что движения глаз при чтении текстов на языках с одинаковой письменностью универсальны. На деле: Сравнение движений глаз во время чтения на русском и адыгейском языках показало, что они отличаются. Причина — в различиях морфосинтаксической структуры этих языков. Теперь подробнее Команда исследователей из Центра языка и мозга и Школы лингвистики НИУ ВШЭ совместно с коллегами из Адыгейского государственного университета сравнила характеристики движения глаз при чтении у носителей двух структурно различных языков — русского, который относится к синтетическим языкам, и адыгейского, входящего в группу полисинтетических языков. Выяснилось, что движения глаз при чтении на языках с разной структурой демонстрируют как сходства, так и различия. При этом чтение на адыгейском языке занимает больше времени и требует более трудоемкой обработки, чем чтение на русском. Исследование подобного рода — с участием билингвов (носителей двух типов языков, один из которых является малым языком России) — проводилось впервые. Статья с результатами работы опубликована в научном журнале https://www.frontiersin.org/journals/psychology/articles/10.3389/fpsyg.2023.1212701/full Исследование проведено в рамках межуниверситетского сотрудничества НИУ ВШЭ и Адыгейского государственного университета. О чём речь? Психолингвистические характеристики слов (частотность слова, длина слова и пр.), влияющие на движения глаз, и, следовательно, на языковую обработку, исследуют не один десяток лет. «Ещё в XX веке заслуженный учёный в области исследования движений глаз Кит Рейнер показал, что на движение глаз при чтении влияют частотность и длина слов, а также их предсказуемость», — поясняет младший научный сотрудник Центра языка и мозга НИУ ВШЭ Нина Здорова. Было обнаружено, что подобные особенности влияют на продолжительность фиксации взгляда на слове, а также на вероятность пропуска слова при чтении (ситуации, когда взгляд на слове не остановится вовсе, и на нём не будет ни одной фиксации). «Так, высокочастотные слова (часто используемые в речи), а также более короткие и контекстуально более предсказуемые слова пропускаются чаще, а если взгляд на них фиксируется, то на более короткое время», — комментирует Нина Здорова. Кроме того, принадлежность слова к той или иной части речи также влияет на то, как эти слова прочитываются. Исследователи выявили ранее, что, например, носители русского языка (как взрослые, так и дети) читают глаголы значительно медленнее, чем существительные, а вероятность пропуска глагола ниже, чем вероятность пропуска существительного. Авторы отмечают, что исследования с использованием метода регистрации движений глаз — видеоокулографии (также известного как айтрекинг) проводятся преимущественно на материале индоевропейских языков и крупных представителей уральской, китайско-тибетской и тюркской языковой семьи — финского, китайского и турецкого соответственно. При этом акцент в кросслингвистических исследованиях делается, прежде всего, на различиях в орфографии и письменности — например, когда сравнивается чтение на английском, китайском и финском языках, или чтение на английском и русском. В ходе текущего исследования фокус был смещен на морфологические различия между языками. Исследователи сравнили движение глаз у билингвов при чтении на двух языках — синтетическом русском и полисинтетическом адыгейском, который является малым языком. В синтетических языках грамматические значения передаются преимущественно с помощью морфем, например аффиксов (приставок, суффиксов, постфиксов). Однако некоторые значения могут быть лексикализованы — то есть выражены с помощью дополнительных слов, а не морфем. В полисинтетических языках явление синтетизма имеет высшую степень: грамматические значения передаются исключительно с помощью морфем, а не с помощью дополнительных слов. В результате этого слова могут быть очень длинными, и одно слово может передавать суть целого предложения. Примеры других полисинтетических языков в России: чукотско-камчатские и эскимосско-алеутские. Условный пример: по-русски мы говорим «я ем вкусную кашу», а на каком-либо полисинтетическом языке это предложение будет уже одним словом «яестькашавкусно». Адыгейский — это один из западнокавказских языков, на котором говорят преимущественно на юге России и в некоторых странах Ближнего Востока. Согласно Всероссийской переписи населения 2020-2021 годов, адыгейский ежедневно используют около 75 800 человек. В этом языке, как и в русском, используется кириллическая письменность, но присутствуют специфические лишь для адыгейского буквы. При этом, как замечают авторы, буквенно-фонемное соответствие в адыгейском не является прямым. Иначе говоря, пишется не так, как слышится. Как изучали? Для исследования авторы работы рекрутировали 65 взрослых билингвов в Майкопе (столице Республики Адыгея). Участники — носители русского и адыгейского языков в возрасте от 18 до 60 лет, средний возраст 30,2 лет. Средний уровень образования респондентов — 14,9 лет. Половина из них (32 человека) являлись студентами Адыгейского государственного университета. Подавляющее большинство участников (42 человека) указали два языка в качестве родных: русский и адыгейский, а 23 участника — только адыгейский. Между тем, почти у всех респондентов (57 человек) родители разговаривают на обоих языках. Билингвизм или двуязычие — это, по определению Франсуа Грожана в рамках психолингвистики, использование двух и более языков (или диалектов) в повседневной жизни. При этом под билингвизмом понимается не только владение несколькими языками с раннего детства. Приобретённые в ходе жизни языки также позволяют отнести человека к группе билингвов. Однако билингвы отличаются между собой по уровню владения языками, сферам их использования и т.д. Термин билингвизм используется и для обозначения мультилингвизма (многоязычия). Так как респонденты являлись носителями различных диалектов адыгейского языка, было важно удостовериться, что понимание прочитанного не отличается в разных диалектных группах, и все участники могут рассматриваться как одна большая и однородная группа испытуемых. В результате анализа различия в понимании среди некоторых участников всё же были обнаружены. В связи с этим итоговая выборка сократилась и составила 50 человек (из них 44 женщины). В ходе экспериментов использовались два корпуса (набора) предложений: 144 на русском и 100 на адыгейском языке. Движения глаз при чтении предложений с экрана ноутбука регистрировались с помощью видеоокулографа (айтрекера) EyeLink Portable Duo ( SR Research, Canada). В числе показателей, которые измерялись — длительность первой фиксации на слове, общее время прочтения слова, вероятность пропуска слова, вероятность фиксации на слове более одного раза. Что получили? По всем основным показателям обнаружилось два значимых эффекта: влияние языка и частотности слова. Чтение на адыгейском языке занимало больше времени и требовало более трудоемкой обработки, чем чтение на русском. Результаты анализа показали, что при чтении на адыгейском маловероятны пропуски слов и единичные фиксации на них и, напротив, — более вероятны две и более фиксации на одном и том же слове. Частотность слова оказывала ожидаемое влияние на движения глаз независимо от языка. «И на русском, и на адыгейском чем выше частотность слова, тем быстрее оно прочитывалось и была менее вероятна необходимость фиксироваться на слове более одного раза. Однако важно отметить, что влияние частотности слова в адыгейском распространялось на движения глаз не так широко, как при чтении на русском», — комментирует Нина Здорова. Этот фактор может быть связан с тем, что для полисинтетического языка, вероятно, важнее смотреть на частотность морфемы, а не всего слова, ведь каждое слово — это уникальная комбинация из множества морфем. Ещё два показателя также оказались значимыми — длина слова и место приземления на слове (локализация первой фиксации). Чем длиннее слово, тем дольше длится первая фиксация и выше вероятность нескольких фиксаций на нём, а также ниже вероятность пропуска слова. Однако при чтении слов одинаковой длины на русском и адыгейском участники демонстрировали разное поведение: слова на адыгейском требовали больше времени на прочтение. «Вероятно, это связано с тем, что длинное слово в адыгейском предполагает б о льшее количество морфем и следовательно, передаёт больше значений и требует больше времени на осмысление», — поясняет исследовательница. Считается, что приземление в центр слова является наиболее эффективным для прочтения. «Глядя в центр, мы можем обработать боковым зрением начало и конец слова и не задерживаться на нём долго. Примерно так и делали испытуемые при чтении на русском, но при чтении на адыгейском место их первой фиксации тяготит к началу слова», — рассказывает Нина Здорова. Скорее всего это обуславливается теми же причинами — длиной и морфологической сложностью слов в адыгейском языке. Для чего это нужно? Несмотря на то, что накоплено много исследований в области движения глаз при чтении на разных языках, до сих пор было мало что известно о читательском поведении билингвов при чтении на малоизученных и типологически отличающихся языках (например, синтетических и полисинтетических). Авторы отмечают, что их новая работа позволила показать различия в чтении на разных языках. При этом впервые были исследованы особенности чтения на материале полисинтетического языка. Полученные результаты важны для фундаментальной науки и планирования последующих психолингвистических экспериментов. С практической точки зрения, новые сведения помогут в написании маркетинговых текстов. «Сегодня рекомендации в этой сфере основываются на знании о том, как читает пользователь на тех самых широко изученных индоевропейских языках (короткие слова читаются быстрее, с высокочастотными словами текст воспринимается легче). Однако эти рекомендации не всегда применимы для текста на полисинтетическом языке», — комментирует Нина Здорова. Она полагает, что подобные экспериментальные исследования помогут понять, на какие характеристики стоит обращать внимание при написании слоганов, пушей и других рекламных материалов на полисинтетическом языке. Источник: iq.hse.ru Комментарии: |
|