Сервис «Яндекс.Переводчик» стал использовать технологии нейронных сетей при переводе текстов, что позволяет повысить качество перевода, сообщили vc.ru в «Яндексе».
Сервис работает по гибридной системе, объясняли в «Яндексе»: к статистической модели, которая работает в «Переводчике» с момента запуска, была добавлена технология перевода с помощью нейросети.
«В отличие от статистического переводчика, нейронная сеть не разбивает тексты на отдельные слова и фразы. Она получает на вход предложение целиком и выдаёт его перевод», — объяснил представитель компании. По его словам, такой подход позволяет учесть контекст и лучше передать смысл переводимого текста.
Статистическая модель, в свою очередь, лучше справляется с редкими словами и фразами, подчеркнули в «Яндексе». «Если смысл предложения непонятен, она не фантазирует, как это может делать нейросеть», — отметили в компании.
При переводе сервис использует обе модели, затем алгоритм машинного обучения CatBoost сравнивает результаты и предлагает лучший, на его взгляд, вариант. «Гибридная система позволяет взять лучшее от каждого метода и повысить качество перевода», — говорят в «Яндексе».
В течение дня 14 сентября в веб-версии «Переводчика» должен появиться переключатель, с помощью которого можно будет сравнить переводы, выполненные гибридной и статистической моделями. При этом иногда сервис может не изменять тексты, отметили в компании: «Это значит, что гибридная модель решила, что статистический перевод лучше».
На первом этапе гибридная система будет работать только для переводов с английского на русский — это самое популярное направление перевода, на него приходится около 80% запросов, говорят в «Яндексе». Добавить другие языковые пары компания планирует в ближайшие несколько месяцев, но точные сроки и языки не называет.
Google использует нейросети для повышения качества перевода в сервисе «Google Переводчик» с 2016 года. Весной 2017 года компания внедрила технологии машинного обучения для улучшения перевода русского языка.