Генерация речи |
||
МЕНЮ Главная страница Поиск Регистрация на сайте Помощь проекту Архив новостей ТЕМЫ Новости ИИ Голосовой помощник Разработка ИИГородские сумасшедшие ИИ в медицине ИИ проекты Искусственные нейросети Искусственный интеллект Слежка за людьми Угроза ИИ ИИ теория Внедрение ИИКомпьютерные науки Машинное обуч. (Ошибки) Машинное обучение Машинный перевод Нейронные сети начинающим Психология ИИ Реализация ИИ Реализация нейросетей Создание беспилотных авто Трезво про ИИ Философия ИИ Big data Работа разума и сознаниеМодель мозгаРобототехника, БПЛАТрансгуманизмОбработка текстаТеория эволюцииДополненная реальностьЖелезоКиберугрозыНаучный мирИТ индустрияРазработка ПОТеория информацииМатематикаЦифровая экономика
Генетические алгоритмы Капсульные нейросети Основы нейронных сетей Распознавание лиц Распознавание образов Распознавание речи Творчество ИИ Техническое зрение Чат-боты Авторизация |
2023-06-09 12:35 Планируется в версии 8.3.25 Мы продолжаем развивать сервисы работы с речью. В версии 8.3.23 появился сервис распознавания речи, а в версии 8.3.25 появится сервис генерации речи из текста. С его помощью можно сгенерировать речь из заданного текста и воспроизвести её или сохранить в файл в формате WAV. Во встроенном языке появятся новые объекты и методы для поддержки этой функциональности. Таким образом, добавляется новый интерфейс взаимодействия системы с пользователем, который не требует от пользователя смотреть на экран. Программа может говорить, что делать и получать обратную реакцию через альтернативные источники (голосовой ввод, переключение режимов работы оборудования и так далее). Это позволит поддержать множество новых сценариев – например работу монтажника с наушником и микрофоном или складского рабочего. Клиент магазина сможет взаимодействовать с говорящим кассовым оборудованием. Система сможет голосом зачитывать отправителя и тему пришедшего письма и, если пользователь скажет «Прочесть», зачитать текст письма целиком. Можно будет создавать полноценные голосовые ассистенты, голосовое управление приложением, интерактивное заполнение форм (например, врачом при осмотре пациента) и т.д. Надо отметить, что мы предоставляем потоковую генерацию - то есть реальное воспроизведение речи начинается с минимальной задержкой, без ожидания, пока текст синтезируется до конца. Пока будет поддерживаться только работа с нашим (1С) сервисом генерации речи (т.е. для работы будет нужно подключение к интернет). При генерации речи можно будет выбрать голос из коллекции голосов, доступных на сервере. Речь будет воспроизводиться на устройстве по умолчанию на клиентском компьютере. Для работы сервиса не нужно будет устанавливать дополнительное ПО ни на клиентских машинах, ни на сервере. Генерация речи будет доступна в тонком, толстом и веб-клиенте. Источник: vk.com Комментарии: |
|