![]() |
![]() |
![]() |
![]() |
Сбер выпустил приложение SaluteSpeech App для Windows и macOS — лёгкая озвучка текста и распознавание речи |
|
МЕНЮ Главная страница Поиск Регистрация на сайте Помощь проекту Архив новостей ТЕМЫ Новости ИИ Голосовой помощник Разработка ИИГородские сумасшедшие ИИ в медицине ИИ проекты Искусственные нейросети Искусственный интеллект Слежка за людьми Угроза ИИ ИИ теория Внедрение ИИКомпьютерные науки Машинное обуч. (Ошибки) Машинное обучение Машинный перевод Нейронные сети начинающим Психология ИИ Реализация ИИ Реализация нейросетей Создание беспилотных авто Трезво про ИИ Философия ИИ Big data Работа разума и сознаниеМодель мозгаРобототехника, БПЛАТрансгуманизмОбработка текстаТеория эволюцииДополненная реальностьЖелезоКиберугрозыНаучный мирИТ индустрияРазработка ПОТеория информацииМатематикаЦифровая экономика
Генетические алгоритмы Капсульные нейросети Основы нейронных сетей Распознавание лиц Распознавание образов Распознавание речи Творчество ИИ Техническое зрение Чат-боты Авторизация |
2023-11-18 13:25 ![]() Команда Сбербанка сообщила о выпуске отдельного приложения для работы с речевыми технологиями — SaluteSpeech App. Как отмечает пресс-служба, это новый удобный инструмент для распознавания аудио и озвучивания текста. Приложение доступно для операционных систем Windows и macOS, отличается простотой использования и включает в себя возможности GigaChat API, программного интерфейса доступа к сервису GigaChat. В SaluteSpeech App два раздела, каждый из которых соответствует своей технологии. Раздел «Распознавание» предназначен для текстовой расшифровки встреч, звонков, интервью и любых других голосовых файлов. Раздел «Синтез», наоборот, позволяет озвучить текст, настраивая паузы и ударения, и даёт возможность скачать готовый аудиофайл на своё устройство. Синтезировать текст можно разными голосами из семи общедоступных вариантов на русском и английском языках. Использование GigaChat API дополнительно упрощает процесс подготовки аудиоконтента. Пользователь может загрузить короткие тезисы и попросить нейросетевую модель на их базе подготовить необходимый текст для последующего синтеза. Например, написать сказку по заданной теме, затем озвучить её, чтобы полученный аудиофайл включать ребенку в машине или перед сном. Также с помощью GigaChat API в приложении SaluteSpeech App можно сделать короткую выжимку протокола встречи, аналитического отчёта или любого другого текста, а затем озвучить полученный материал. Есть множество и других кейсов, всё зависит от задач и фантазии пользователя. Как обещают в Сбере, приложение будет доступно всем желающим без оплаты и подойдёт для решения самых разных задач. Источник: www.ixbt.com Комментарии: |
|