Google разработала алгоритм перевода устной речи Translatotron, способный сохранять интонацию и голос говорящего |
||
|
МЕНЮ Главная страница Поиск Регистрация на сайте Помощь проекту Архив новостей ТЕМЫ Новости ИИ Голосовой помощник Разработка ИИГородские сумасшедшие ИИ в медицине ИИ проекты Искусственные нейросети Искусственный интеллект Слежка за людьми Угроза ИИ Атаки на ИИ Внедрение ИИИИ теория Компьютерные науки Машинное обуч. (Ошибки) Машинное обучение Машинный перевод Нейронные сети начинающим Психология ИИ Реализация ИИ Реализация нейросетей Создание беспилотных авто Трезво про ИИ Философия ИИ Big data Работа разума и сознаниеМодель мозгаРобототехника, БПЛАТрансгуманизмОбработка текстаТеория эволюцииДополненная реальностьЖелезоКиберугрозыНаучный мирИТ индустрияРазработка ПОТеория информацииМатематикаЦифровая экономика
Генетические алгоритмы Капсульные нейросети Основы нейронных сетей Промпты. Генеративные запросы Распознавание лиц Распознавание образов Распознавание речи Творчество ИИ Техническое зрение Чат-боты Авторизация |
2019-06-23 18:05 проблемы машинного перевода, алгоритмы распознавания речи, распознавание образов Нейросеть переводит речь напрямую, пропуская этап конвертации аудио в текст. Google разработала алгоритм Translatotron, который напрямую переводит устную речь на разные языки, минуя конвертацию в текст. Система также умеет сохранять голос и интонацию пользователя. Об этом компания сообщила в своём блоге. В существующих переводчиках, включая Google Translate, при устном переводе звук сначала конвертируется в текст, а потом обратно в аудио. Основное отличие Translatotron в том, что он пропускает этот этап и работает напрямую со звуком — система создаёт «слепок» исходной речи и преобразует её. Подобный алгоритм позволяет увеличить скорость перевода, сократить число ошибок в распознавании речи и при переводе слов, которые не нужно переводить, например, имён. Специалисты Google отмечают, что Translatotron — первая система прямого перевода без конвертации в текст. Кроме того, алгоритм научили сохранить интонации и паузы говорящего, чтобы сделать звучание перевода более естественным. Нейросеть также может сохранять исходный голос, но эта система обучена на меньшем количестве данных, поэтому варианты перевода получаются немного разными. Посмотреть примеры переводов алгоритма можно в репозитории Google на GitHub. Телеграм: t.me/ainewsline Источник: tjournal.ru Комментарии: |
|