«Потрачено»: сможет ли машина заменить живого переводчика

2020-07-06 12:00

Не секрет, что роботы скоро заменят нас во многих профессиях, и кажется, что переводчики стоят в первых рядах: уже сейчас есть средства для перевода текста и распознавания речи

Но пока «живые» специалисты не остаются без работы. Почему компьютер пока не может догнать человека? И может ли это все-таки произойти? Об этом мы расскажем в кратком изложении лекции Алексея Малова.

О спикере: Алексей Малов — практикующий переводчик-синхронист, кандидат филологических наук, координатор переводчиков и редакторов студии «Vert Dider».

Алексей Малов — Переводчик умер, да здравствует переводчик!

Как работают современные автоматические системы перевода

В общих чертах, существует три системы:

Перевод на основе правил.

С этого начинались первые системы машинного перевода. Их проблема состоит в том, что машина, зачастую, переводит слишком дословно, строго следуя заданным параметрам и не используя синонимы, из-за чего текст оказывается некорректным. Примером могут служить меню кафе или странички в путеводителях где-нибудь за границей лет десять тому назад, где можно было встретить совершенно невероятные блюда вроде «овощей с нефтью» и рассказы о поездке на «говяжьей упряжке». Правда, вряд ли какая-то из существующих систем перевода на основе правил сейчас выдаст такую же ошибку, так как их постоянно совершенствуют.

Статистический перевод.

На настоящий момент существует множество параллельных текстов (на русском и иностранном языке), которые оцифрованы и загнаны на сервера и оформлены в параллельный корпус (текст оригинала и его перевод на другой язык выровнены так, что все фрагменты оригинала совпадают с соответствующими фрагментами перевода). С их помощью человек может понять, в каких случаях то или иное слово употреблялось, с какими зависимыми словами, в каком контексте и т.д. Задача системы в данном случае — найти максимально подходящее соответствие, которое уже перевели, и выдать этот вариант. Проблема: наиболее частый вариант перевода не всегда соответствует конкретной ситуации. Самый яркий пример — слово «wasted», всплывающее после смерти персонажа в игре GTA, которое на русский язык было неверно переведено как «потрачено».

Машинный перевод.

Машины хорошо учатся и уже обыгрывают нас в го и шахматы, рисуют картины, сочиняют песни и оценивают работы студентов не хуже преподавателей. Когда они заменят человека в вопросах перевода и заменят ли?

Они уже (чаще всего) разбираются в синонимах, и это, на первый взгляд, действительно создает угрозу «живым» специалистам. Но все не так просто.

Одна из проблем машинного перевода заключается в распознавании нюансов, оттенков эмоций и контекста. Во многом люди и сами не до конца умеют распознавать эти тонкости: учитывая, что машины пока обучаются людьми, говорить о полной замене переводчиков роботами некорректно.

Как научить машины распознавать эмоции, которые мы сами не всегда ясно определяем?

Можно обратиться к лингвистам и филологам, однако никто из них не даст точную оценку того, что конкретно считать яростью, что — гневом, а что — злостью. Но можно обратиться к нейропсихологам.

Существует квартетная теория человеческих эмоций, согласно которой в нашем мозге есть несколько зон, отвечающих за то, что мы чувствуем: ствол, диэнцефалон, гиппокамп и орбитофронтальная кора. Понимание того, как работают эти зоны, может существенно облегчить работу специалистов по машинному переводу. Идя дальше, можно проанализировать с помощью МРТ активность мозга различных людей, вызвав у них определенные эмоции и попросив описать то, что они при этом чувствуют, после чего сравнить результаты с ответами иностранных испытуемых. А эти данные уже подвергнуть оцифровке и использовать в обучении машин. Но МРТ — дорогая диагностика, используемая в медицине, и ее применение в лингвистических вопросах не всегда целесообразно. Однако Университет Беркли все же задался похожей целью: ученые зачитывали тексты испытуемым и мониторили их активность мозга, после чего сравнили слова, которые были зачитаны, с тем, какая часть мозга была активна в это время. В результате была составлена семантическая карта мозга.

Также в определении эмоций и последующем обучении этому машин может помочь скалярный подход (суть заключается в том, что любому эмоциональному стимулу, в том числе и вербальному, присваивается числовое значение по шкалам, каждая из которых отражает одну из характеристик). Эксперименты с его применением уже проводились: носителям разных языков называли определенные слова и просили оценить, используя шкалы, что они при этом чувствуют. С помощью этих опросов были сформированы несколько баз данных для разных языков, но русского там нет.

Проведя собственное исследование, Алексей выяснил интересную вещь: слова англоязычные и русскоязычные носители «чувствуют» с совершенно с разной интенсивностью. Его респондентам нужно было оценить то, насколько позитивную или негативную эмоцию они испытывают при упоминании слова «sad», то есть грусть, печаль. Англоговорящие респонденты оценили ее по шкале от 1 до 9 на 1,6, то есть это — почти самая негативная эмоция, которую они могли бы испытать. Русскоязычные участники исследования же оценили эмоцию примерно на 3,5. Вероятно, в нашем сознании сильны такие понятия как приятная грусть или светлая печаль. Это еще раз доказывает важность контекста, а также происхождения, опыта и эмоционального интеллекта конкретного человека.

Пока мы сами до конца не разобрались, как все это работает, мы не сможем научить этому машину. И пока ни одна из существующих систем перевода не лучше человека. Лишат ли они работы переводчиков в будущем? Плохих — скорее всего. Хороших — вряд ли.

Телеграм: t.me/ainewsline

Источник: trends.rbc.ru



		«Потрачено»: сможет ли машина заменить живого переводчика
МЕНЮ Главная страница Поиск Регистрация на сайте Помощь проекту Архив новостей ТЕМЫ Новости ИИ Голосовой помощник Городские сумасшедшие ИИ в медицине ИИ проекты Искусственные нейросети Искусственный интеллект Слежка за людьми Угроза ИИ Разработка ИИ Атаки на ИИ ИИ теория Компьютерные науки Машинное обуч. (Ошибки) Машинное обучение Машинный перевод Нейронные сети начинающим Психология ИИ Реализация ИИ Реализация нейросетей Создание беспилотных авто Трезво про ИИ Философия ИИ Внедрение ИИ Big data Генетические алгоритмы Капсульные нейросети Основы нейронных сетей Промпты. Генеративные запросы Распознавание лиц Распознавание образов Распознавание речи Творчество ИИ Техническое зрение Чат-боты Работа разума и сознание Изучение сна Изучение сознания Нейроинтерфейс Психология Работа мозга Работа памяти Работа разума Модель мозга Модель мозга Робототехника, БПЛА Беспилотные автомобили БПЛА Робототехника Трансгуманизм Трансгуманизм Обработка текста Анализ социальных сетей Компьютерная лингвистика Лингвистика Поисковые алгоритмы Теория эволюции Головной мозг Нейронные сети Поведение животных Теория эволюции Дополненная реальность Виртулаьная реальность Дополненная реальность Железо Интернет вещей Квантовый компьютер Нейронные процессоры облачные вычисления Суперкомпьютеры Киберугрозы Кибербезопасность Научный мир Методы исследования Наука и образование Семинары ИТ индустрия ИТ-гиганты Новости ит Разработка ПО Разработка ПО Теория алгоритмов Теория информации Кластеризация Математика Актуальная математика Статистика Теория вероятности Теория информации Теория хаоса Цифровая экономика Технология блокчейн Цифровая экономика Авторизация RSS RSS новости		2020-07-06 12:00 алгоритмы машинного перевода Не секрет, что роботы скоро заменят нас во многих профессиях, и кажется, что переводчики стоят в первых рядах: уже сейчас есть средства для перевода текста и распознавания речи Но пока «живые» специалисты не остаются без работы. Почему компьютер пока не может догнать человека? И может ли это все-таки произойти? Об этом мы расскажем в кратком изложении лекции Алексея Малова. О спикере: Алексей Малов — практикующий переводчик-синхронист, кандидат филологических наук, координатор переводчиков и редакторов студии «Vert Dider». Алексей Малов — Переводчик умер, да здравствует переводчик! Как работают современные автоматические системы перевода В общих чертах, существует три системы: Перевод на основе правил. С этого начинались первые системы машинного перевода. Их проблема состоит в том, что машина, зачастую, переводит слишком дословно, строго следуя заданным параметрам и не используя синонимы, из-за чего текст оказывается некорректным. Примером могут служить меню кафе или странички в путеводителях где-нибудь за границей лет десять тому назад, где можно было встретить совершенно невероятные блюда вроде «овощей с нефтью» и рассказы о поездке на «говяжьей упряжке». Правда, вряд ли какая-то из существующих систем перевода на основе правил сейчас выдаст такую же ошибку, так как их постоянно совершенствуют. Статистический перевод. На настоящий момент существует множество параллельных текстов (на русском и иностранном языке), которые оцифрованы и загнаны на сервера и оформлены в параллельный корпус (текст оригинала и его перевод на другой язык выровнены так, что все фрагменты оригинала совпадают с соответствующими фрагментами перевода). С их помощью человек может понять, в каких случаях то или иное слово употреблялось, с какими зависимыми словами, в каком контексте и т.д. Задача системы в данном случае — найти максимально подходящее соответствие, которое уже перевели, и выдать этот вариант. Проблема: наиболее частый вариант перевода не всегда соответствует конкретной ситуации. Самый яркий пример — слово «wasted», всплывающее после смерти персонажа в игре GTA, которое на русский язык было неверно переведено как «потрачено». Машинный перевод. Машины хорошо учатся и уже обыгрывают нас в го и шахматы, рисуют картины, сочиняют песни и оценивают работы студентов не хуже преподавателей. Когда они заменят человека в вопросах перевода и заменят ли? Они уже (чаще всего) разбираются в синонимах, и это, на первый взгляд, действительно создает угрозу «живым» специалистам. Но все не так просто. Одна из проблем машинного перевода заключается в распознавании нюансов, оттенков эмоций и контекста. Во многом люди и сами не до конца умеют распознавать эти тонкости: учитывая, что машины пока обучаются людьми, говорить о полной замене переводчиков роботами некорректно. Как научить машины распознавать эмоции, которые мы сами не всегда ясно определяем? Можно обратиться к лингвистам и филологам, однако никто из них не даст точную оценку того, что конкретно считать яростью, что — гневом, а что — злостью. Но можно обратиться к нейропсихологам. Существует квартетная теория человеческих эмоций, согласно которой в нашем мозге есть несколько зон, отвечающих за то, что мы чувствуем: ствол, диэнцефалон, гиппокамп и орбитофронтальная кора. Понимание того, как работают эти зоны, может существенно облегчить работу специалистов по машинному переводу. Идя дальше, можно проанализировать с помощью МРТ активность мозга различных людей, вызвав у них определенные эмоции и попросив описать то, что они при этом чувствуют, после чего сравнить результаты с ответами иностранных испытуемых. А эти данные уже подвергнуть оцифровке и использовать в обучении машин. Но МРТ — дорогая диагностика, используемая в медицине, и ее применение в лингвистических вопросах не всегда целесообразно. Однако Университет Беркли все же задался похожей целью: ученые зачитывали тексты испытуемым и мониторили их активность мозга, после чего сравнили слова, которые были зачитаны, с тем, какая часть мозга была активна в это время. В результате была составлена семантическая карта мозга. Также в определении эмоций и последующем обучении этому машин может помочь скалярный подход (суть заключается в том, что любому эмоциональному стимулу, в том числе и вербальному, присваивается числовое значение по шкалам, каждая из которых отражает одну из характеристик). Эксперименты с его применением уже проводились: носителям разных языков называли определенные слова и просили оценить, используя шкалы, что они при этом чувствуют. С помощью этих опросов были сформированы несколько баз данных для разных языков, но русского там нет. Проведя собственное исследование, Алексей выяснил интересную вещь: слова англоязычные и русскоязычные носители «чувствуют» с совершенно с разной интенсивностью. Его респондентам нужно было оценить то, насколько позитивную или негативную эмоцию они испытывают при упоминании слова «sad», то есть грусть, печаль. Англоговорящие респонденты оценили ее по шкале от 1 до 9 на 1,6, то есть это — почти самая негативная эмоция, которую они могли бы испытать. Русскоязычные участники исследования же оценили эмоцию примерно на 3,5. Вероятно, в нашем сознании сильны такие понятия как приятная грусть или светлая печаль. Это еще раз доказывает важность контекста, а также происхождения, опыта и эмоционального интеллекта конкретного человека. Пока мы сами до конца не разобрались, как все это работает, мы не сможем научить этому машину. И пока ни одна из существующих систем перевода не лучше человека. Лишат ли они работы переводчиков в будущем? Плохих — скорее всего. Хороших — вряд ли. Телеграм: t.me/ainewsline Источник: trends.rbc.ru Комментарии:

«Потрачено»: сможет ли машина заменить живого переводчика

Комментарии: