Многоязычность в контексте машинного перевода

2019-12-03 09:49

В последние годы машинный перевод стал более эффективным благодаря новым разработкам в области искусственного интеллекта. В чем особенности этой технологии? Каковы ее преимущества и возможные последствия для качественного лингвистического образования?

Von Ральф Крюгер

Если вы недавно использовали систему машинного перевода, например, Google Переводчик, то наверняка были приятно удивлены качеством перевода. Если раньше система выдавала исключительно непонятные конструкции с досадными ошибками, вызывающими порой улыбку, порой недоумение, то современное программное обеспечение предлагает переводы, которые не только верно передают содержание исходного текста, но и учитывают стилистику языка. Что же изменилось?

Победное Шествие Нейронных Сетей

Ответ кроется в новейших успешных разработках в области искусственного интеллекта, которые базируются на использовании так называемых искусственных нейронных сетей. Идея воссоздать с помощью вычислительных машин структуру человеческого мозга с миллиардами связанных между собой нервных клеток (нейронов) в виде искусственных сетей появилась уже в 1940-х годах. Однако лишь недавно были достигнуты два важнейших условия для реализации этой идеи: достаточно высокая вычислительная мощность и возможность доступа к большим массивам данных (Big Data), с помощью которых можно тренировать нейронные сети. Этот подход, называемый глубоким обучением, кардинально отличается от прежних методов работы с искусственным интеллектом, когда осуществлялись попытки выполнить поставленные задачи, исходя из четко запрограммированных наборов правил. Искусственные нейронные сети анализируют определенные шаблоны или закономерности в массивах данных и выводят свои собственные, недоступные для понимания человека, правила для решения конкретной задачи.

Описанные выше противоположные подходы и сегодня используются и в машинном переводе. Так называемый машинный перевод на основе правил анализирует предложение на исходном языке строго в соответствии с заранее заданными правилами грамматики и лексики и генерирует перевод, опираясь на соответствующие правила целевого языка. Однако естественные языки – это необычайно сложные структуры, и в отличие от языков программирования они демонстрируют лишь относительную регулярность и характеризуются многочисленными исключениями, а в некоторых случаях даже противоречиями. Поэтому успех данного подхода весьма скромный. При нейронном машинном переводе нейронная сеть работает с привлечением большого количества исходных текстов и их переводов и извлекает из этих данных определенные шаблоны. При этом как будто создается искусственный мозг переводчика, который учится самостоятельно переводить новые тексты на основе сохраненных в памяти данных.

СОВРЕМЕННЫЙ УРОВЕНЬ МАШИННОГО ПЕРЕВОДА

Нейронная сеть Нейронные программы перевода формируют искусственный мозг переводчика. | Фото: Альфред Пасека © Mauritius images – Научная Фотобиблиотека Достижения нового подхода впечатляют. Нейронный машинный перевод был запущен всего лишь четыре года назад и в кратчайшие сроки превзошел по качеству прежние подходы. В марте 2018 года исследовательская группа Microsoft заявила, что их система нейронного перевода уже вышла на «человеческий уровень» при переводе газетных статей с китайского языка на английский, то есть по качеству перевод, выполненный машиной ни в чем не уступает переводу, выполненному человеком.

Однако такие заявления следует рассматривать с осторожностью и ни в коем случае не распространять их на все языковые направления и предметные области. В целом справедливым будет сказать, что даже нейронный машинный перевод небезупречен. Основную проблему представляет присущая естественным языкам неоднозначность. Люди всегда интерпретируют высказывания в определенном контексте. Так, например, из вырванного из контекста предложения «I arrived at the bank» невозможно понять, прибыл говорящий на берег реки или в финансовое учреждение. Слушателю для интерпретации, понимания нужен контекст. Машинный перевод не учитывает контекст и поэтому априори предрасположен к ошибкам. Следовательно, мечта об универсальном переводчике, с помощью которого можно преодолеть вавилонское смешение языков, пока не стала реальностью.

ПОЛЬЗА МАШИННОГО ПЕРЕВОДА ДЛЯ ОБЩЕСТВА

Несмотря на то, что машинный перевод до сих пор сталкивается с многочисленными проблемами, он является полезным инструментом для информативного перевода. Сегодня благодаря использованию смартфонов и других гаджетов пользователи в любое время имеют доступ к облачным службам перевода, таким как Google Переводчик, и могут использовать их для элементарного понимания иноязычных текстов. Интересной разработкой являются так называемые наушники-переводчики, например, Pixel Buds от Google. Эти беспроводные наушники используют распознавание речи, чтобы преобразовать иноязычное высказывание в машиночитаемый текст, а затем переводят его с помощью Google Переводчика на выбранный язык, и, наконец, воспроизводят результат, делая тем самым возможным применение машинного перевода для устного общения. Однако при этом значительно возрастает подверженность ошибкам из-за тройного преобразования: распознавания речи, перевода и речевого вывода. Кроме того, разговорная речь менее структурирована и сильно привязана к конкретной ситуации общения.

Помимо этого, на институциональном уровне предпринимаются усилия, чтобы использовать машинный перевод на благо общества. Так, Немецкий исследовательский центр по искусственному интеллекту планирует участие в финансируемом ЕС проекте «Человеческий язык» (The Human Language Project), который среди прочего направлен на то, чтобы расширить вовлеченность малообразованных, пожилых людей и мигрантов в жизнь многоязычной Европы путем развития языковых технологий. Кроме того, в настоящее время в рамках проекта ЕС INTERACT (International Network on Crisis Translation – Международная сеть по кризисному переводу) исследователи рассматривают возможность использования машинного перевода в стихийных бедствиях, когда решающее значение имеет максимально быстрое преодоление языкового барьера.

Диалоги людей

Машина не способна распознать речевые нюансы и, следовательно, преодолеть языковые барьеры. | Фото: stm © photocase.de

О ПРЕИМУЩЕСТВАХ МНОГОЯЗЫЧНОСТИ

Вышесказанное наводит на мысль о том, что изучение иностранных языков в будущем станет удовольствием из разряда роскоши, которое смогут себе позволить только лингвисты-энтузиасты. Но это впечатление обманчиво. Мы уже описали проблемы качества, характерные для машинного перевода. А богатое нюансами общение между носителями разных языков, которое включает в себя не только лингвистическую, но и культурную составляющую, машина, вероятно, никогда не сможет освоить.

На фоне крайне заманчивой и многообещающей перспективы машинного перевода преимущества многоязычности становятся все более очевидными. Тот, кто отказывается от изучения иностранного языка хотя бы на базовом уровне и знакомится с иностранными культурами, опираясь исключительно на машинный перевод, не только отрицает прямое и непосредственное общение с другими людьми, но и запирается в рамках своего собственного языка. Ведь при изучении нового языка мы открываем новый взгляд на мир, иной способ выразить реальность словами. Такая межкультурная эмпатия необходима современному глобализированному миру, ведь любое возможное недопонимание может легко привести к конфликту.

ЛИТЕРАТУРА

Крюгер, Ральф (2017): О сетях и векторах – нейронный машинный перевод. В MD? – Журнал для устных и письменных переводчиков, № 63. том 1.

Автор

Ральф Крюгер – профессор языковых и переводческих технологий в Институте перевода и многоязычной коммуникации Технического университета Кёльна. Занимается вопросами удобства использования инструментов языковых и переводческих технологий, а также возможностями нейронного машинного перевода.

Если у Вас есть вопросы по этой статье, напишите нам!

- Информация о защите персональных данных
Informationen zu

Social-Media-Diensten

Wir wollen Ihre Privatsph?re sch?tzen

Eine Website, die solche Buttons enth?lt, ?bermittelt ohne Ihre Zustimmung personenbezogene Daten an die betreffenden sozialen Netzwerke. Der Button muss dazu nicht von Ihnen gedr?ckt worden sein. Das widerspricht den deutschen Datenschutzbestimmungen.
Um Ihre Privatsph?re zu sch?tzen, verwendet das Goethe-Institut eine sogenannte 2-Klick L?sung. Diese wird in ?hnlicher Form von zahlreichen Website-Betreibern eingesetzt und ist sehr einfach zu bedienen.

Artikel auf goethe.de weiterempfehlen

So funktioniert die 2-Klick L?sung: Wenn Sie sich auf goethe.de aufhalten, ist die Empfehlungsfunktion der Buttons als Standard inaktiv. Durch wenige Klicks haben Sie die M?glichkeit, das zu ?ndern:

1. Mit dem ersten Klick ?ffnet sich ein erkl?rendes Fenster.

2. Mit dem zweiten Klick k?nnen Sie Ihre Zustimmung geben, dass die Empfehlungsfunktion der sozialen Netzwerke aktiviert wird.
Распечатать статью

Ссылки по теме

Источник: www.goethe.de



		Многоязычность в контексте машинного перевода
МЕНЮ Главная страница Поиск Регистрация на сайте Помощь проекту Архив новостей ТЕМЫ Новости ИИ Голосовой помощник Городские сумасшедшие ИИ в медицине ИИ проекты Искусственные нейросети Искусственный интеллект Слежка за людьми Угроза ИИ Разработка ИИ ИИ теория Компьютерные науки Машинное обуч. (Ошибки) Машинное обучение Машинный перевод Нейронные сети начинающим Реализация ИИ Реализация нейросетей Создание беспилотных авто Трезво про ИИ Философия ИИ Внедрение ИИ Big data Генетические алгоритмы Капсульные нейросети Основы нейронных сетей Распознавание лиц Распознавание образов Распознавание речи Техническое зрение Чат-боты Работа разума и сознание Изучение сна Изучение сознания Нейроинтерфейс Психология Работа мозга Работа памяти Работа разума Модель мозга Модель мозга Робототехника, БПЛА Беспилотные автомобили БПЛА Робототехника Трансгуманизм Трансгуманизм Обработка текста Анализ социальных сетей Компьютерная лингвистика Лингвистика Поисковые алгоритмы Теория эволюции Головной мозг Нейронные сети Поведение животных Теория эволюции Дополненная реальность Виртулаьная реальность Дополненная реальность Железо Интернет вещей Квантовый компьютер Нейронные процессоры облачные вычисления Суперкомпьютеры Киберугрозы Кибербезопасность Научный мир Методы исследования Наука и образование Семинары ИТ индустрия ИТ-гиганты Новости ит Разработка ПО Разработка ПО Теория алгоритмов Теория информации Кластеризация Математика Актуальная математика Статистика Теория вероятности Теория информации Теория хаоса Цифровая экономика Технология блокчейн Цифровая экономика Авторизация RSS RSS новости		2019-12-03 09:49 проблемы машинного перевода В последние годы машинный перевод стал более эффективным благодаря новым разработкам в области искусственного интеллекта. В чем особенности этой технологии? Каковы ее преимущества и возможные последствия для качественного лингвистического образования? Von Ральф Крюгер Если вы недавно использовали систему машинного перевода, например, Google Переводчик, то наверняка были приятно удивлены качеством перевода. Если раньше система выдавала исключительно непонятные конструкции с досадными ошибками, вызывающими порой улыбку, порой недоумение, то современное программное обеспечение предлагает переводы, которые не только верно передают содержание исходного текста, но и учитывают стилистику языка. Что же изменилось? Победное Шествие Нейронных Сетей Ответ кроется в новейших успешных разработках в области искусственного интеллекта, которые базируются на использовании так называемых искусственных нейронных сетей. Идея воссоздать с помощью вычислительных машин структуру человеческого мозга с миллиардами связанных между собой нервных клеток (нейронов) в виде искусственных сетей появилась уже в 1940-х годах. Однако лишь недавно были достигнуты два важнейших условия для реализации этой идеи: достаточно высокая вычислительная мощность и возможность доступа к большим массивам данных (Big Data), с помощью которых можно тренировать нейронные сети. Этот подход, называемый глубоким обучением, кардинально отличается от прежних методов работы с искусственным интеллектом, когда осуществлялись попытки выполнить поставленные задачи, исходя из четко запрограммированных наборов правил. Искусственные нейронные сети анализируют определенные шаблоны или закономерности в массивах данных и выводят свои собственные, недоступные для понимания человека, правила для решения конкретной задачи. Описанные выше противоположные подходы и сегодня используются и в машинном переводе. Так называемый машинный перевод на основе правил анализирует предложение на исходном языке строго в соответствии с заранее заданными правилами грамматики и лексики и генерирует перевод, опираясь на соответствующие правила целевого языка. Однако естественные языки – это необычайно сложные структуры, и в отличие от языков программирования они демонстрируют лишь относительную регулярность и характеризуются многочисленными исключениями, а в некоторых случаях даже противоречиями. Поэтому успех данного подхода весьма скромный. При нейронном машинном переводе нейронная сеть работает с привлечением большого количества исходных текстов и их переводов и извлекает из этих данных определенные шаблоны. При этом как будто создается искусственный мозг переводчика, который учится самостоятельно переводить новые тексты на основе сохраненных в памяти данных. СОВРЕМЕННЫЙ УРОВЕНЬ МАШИННОГО ПЕРЕВОДА Нейронные программы перевода формируют искусственный мозг переводчика. \| Фото: Альфред Пасека © Mauritius images – Научная Фотобиблиотека Достижения нового подхода впечатляют. Нейронный машинный перевод был запущен всего лишь четыре года назад и в кратчайшие сроки превзошел по качеству прежние подходы. В марте 2018 года исследовательская группа Microsoft заявила, что их система нейронного перевода уже вышла на «человеческий уровень» при переводе газетных статей с китайского языка на английский, то есть по качеству перевод, выполненный машиной ни в чем не уступает переводу, выполненному человеком. Однако такие заявления следует рассматривать с осторожностью и ни в коем случае не распространять их на все языковые направления и предметные области. В целом справедливым будет сказать, что даже нейронный машинный перевод небезупречен. Основную проблему представляет присущая естественным языкам неоднозначность. Люди всегда интерпретируют высказывания в определенном контексте. Так, например, из вырванного из контекста предложения «I arrived at the bank» невозможно понять, прибыл говорящий на берег реки или в финансовое учреждение. Слушателю для интерпретации, понимания нужен контекст. Машинный перевод не учитывает контекст и поэтому априори предрасположен к ошибкам. Следовательно, мечта об универсальном переводчике, с помощью которого можно преодолеть вавилонское смешение языков, пока не стала реальностью. ПОЛЬЗА МАШИННОГО ПЕРЕВОДА ДЛЯ ОБЩЕСТВА Несмотря на то, что машинный перевод до сих пор сталкивается с многочисленными проблемами, он является полезным инструментом для информативного перевода. Сегодня благодаря использованию смартфонов и других гаджетов пользователи в любое время имеют доступ к облачным службам перевода, таким как Google Переводчик, и могут использовать их для элементарного понимания иноязычных текстов. Интересной разработкой являются так называемые наушники-переводчики, например, Pixel Buds от Google. Эти беспроводные наушники используют распознавание речи, чтобы преобразовать иноязычное высказывание в машиночитаемый текст, а затем переводят его с помощью Google Переводчика на выбранный язык, и, наконец, воспроизводят результат, делая тем самым возможным применение машинного перевода для устного общения. Однако при этом значительно возрастает подверженность ошибкам из-за тройного преобразования: распознавания речи, перевода и речевого вывода. Кроме того, разговорная речь менее структурирована и сильно привязана к конкретной ситуации общения. Помимо этого, на институциональном уровне предпринимаются усилия, чтобы использовать машинный перевод на благо общества. Так, Немецкий исследовательский центр по искусственному интеллекту планирует участие в финансируемом ЕС проекте «Человеческий язык» (The Human Language Project), который среди прочего направлен на то, чтобы расширить вовлеченность малообразованных, пожилых людей и мигрантов в жизнь многоязычной Европы путем развития языковых технологий. Кроме того, в настоящее время в рамках проекта ЕС INTERACT (International Network on Crisis Translation – Международная сеть по кризисному переводу) исследователи рассматривают возможность использования машинного перевода в стихийных бедствиях, когда решающее значение имеет максимально быстрое преодоление языкового барьера. Машина не способна распознать речевые нюансы и, следовательно, преодолеть языковые барьеры. \| Фото: stm © photocase.de О ПРЕИМУЩЕСТВАХ МНОГОЯЗЫЧНОСТИ Вышесказанное наводит на мысль о том, что изучение иностранных языков в будущем станет удовольствием из разряда роскоши, которое смогут себе позволить только лингвисты-энтузиасты. Но это впечатление обманчиво. Мы уже описали проблемы качества, характерные для машинного перевода. А богатое нюансами общение между носителями разных языков, которое включает в себя не только лингвистическую, но и культурную составляющую, машина, вероятно, никогда не сможет освоить. На фоне крайне заманчивой и многообещающей перспективы машинного перевода преимущества многоязычности становятся все более очевидными. Тот, кто отказывается от изучения иностранного языка хотя бы на базовом уровне и знакомится с иностранными культурами, опираясь исключительно на машинный перевод, не только отрицает прямое и непосредственное общение с другими людьми, но и запирается в рамках своего собственного языка. Ведь при изучении нового языка мы открываем новый взгляд на мир, иной способ выразить реальность словами. Такая межкультурная эмпатия необходима современному глобализированному миру, ведь любое возможное недопонимание может легко привести к конфликту. ЛИТЕРАТУРА Крюгер, Ральф (2017): О сетях и векторах – нейронный машинный перевод. В MD? – Журнал для устных и письменных переводчиков, № 63. том 1. Автор Ральф Крюгер – профессор языковых и переводческих технологий в Институте перевода и многоязычной коммуникации Технического университета Кёльна. Занимается вопросами удобства использования инструментов языковых и переводческих технологий, а также возможностями нейронного машинного перевода. Copyright: Гёте-Институт, редакция журнала Magazin Sprache апрель 2018 Если у Вас есть вопросы по этой статье, напишите нам! Информация о защите персональных данных Informationen zu Social-Media-Diensten Wir wollen Ihre Privatsph?re sch?tzen Eine Website, die solche Buttons enth?lt, ?bermittelt ohne Ihre Zustimmung personenbezogene Daten an die betreffenden sozialen Netzwerke. Der Button muss dazu nicht von Ihnen gedr?ckt worden sein. Das widerspricht den deutschen Datenschutzbestimmungen. Um Ihre Privatsph?re zu sch?tzen, verwendet das Goethe-Institut eine sogenannte 2-Klick L?sung. Diese wird in ?hnlicher Form von zahlreichen Website-Betreibern eingesetzt und ist sehr einfach zu bedienen. Artikel auf goethe.de weiterempfehlen So funktioniert die 2-Klick L?sung: Wenn Sie sich auf goethe.de aufhalten, ist die Empfehlungsfunktion der Buttons als Standard inaktiv. Durch wenige Klicks haben Sie die M?glichkeit, das zu ?ndern: 1. Mit dem ersten Klick ?ffnet sich ein erkl?rendes Fenster. 2. Mit dem zweiten Klick k?nnen Sie Ihre Zustimmung geben, dass die Empfehlungsfunktion der sozialen Netzwerke aktiviert wird. Распечатать статью Ссылки по теме INTERACT (International Network on Crisis Translation) The Great A.I. Awakening - The history of advances in neural machine translation at Google Language equality in the digital age – Towards a Human Language Project (pdf) Источник: www.goethe.de Комментарии:

Многоязычность в контексте машинного перевода

Комментарии: