Генерация речи

МЕНЮ


Главная страница
Поиск
Регистрация на сайте
Помощь проекту
Архив новостей

ТЕМЫ


Новости ИИРазработка ИИВнедрение ИИРабота разума и сознаниеМодель мозгаРобототехника, БПЛАТрансгуманизмОбработка текстаТеория эволюцииДополненная реальностьЖелезоКиберугрозыНаучный мирИТ индустрияРазработка ПОТеория информацииМатематикаЦифровая экономика

Авторизация



RSS


RSS новости


2023-06-09 12:35

Планируется в версии 8.3.25

Мы продолжаем развивать сервисы работы с речью. В версии 8.3.23 появился сервис распознавания речи, а в версии 8.3.25 появится сервис генерации речи из текста.

С его помощью можно сгенерировать речь из заданного текста и воспроизвести её или сохранить в файл в формате WAV. Во встроенном языке появятся новые объекты и методы для поддержки этой функциональности.

Таким образом, добавляется новый интерфейс взаимодействия системы с пользователем, который не требует от пользователя смотреть на экран. Программа может говорить, что делать и получать обратную реакцию через альтернативные источники (голосовой ввод, переключение режимов работы оборудования и так далее).

Это позволит поддержать множество новых сценариев – например работу монтажника с наушником и микрофоном или складского рабочего. Клиент магазина сможет взаимодействовать с говорящим кассовым оборудованием. Система сможет голосом зачитывать отправителя и тему пришедшего письма и, если пользователь скажет «Прочесть», зачитать текст письма целиком. Можно будет создавать полноценные голосовые ассистенты, голосовое управление приложением, интерактивное заполнение форм (например, врачом при осмотре пациента) и т.д.

Надо отметить, что мы предоставляем потоковую генерацию - то есть реальное воспроизведение речи начинается с минимальной задержкой, без ожидания, пока текст синтезируется до конца.

Пока будет поддерживаться только работа с нашим (1С) сервисом генерации речи (т.е. для работы будет нужно подключение к интернет).

При генерации речи можно будет выбрать голос из коллекции голосов, доступных на сервере.

Речь будет воспроизводиться на устройстве по умолчанию на клиентском компьютере.

Для работы сервиса не нужно будет устанавливать дополнительное ПО ни на клиентских машинах, ни на сервере.

Генерация речи будет доступна в тонком, толстом и веб-клиенте.


Источник: vk.com

Комментарии: