Как перевести речевой аудио-файл в текст с помощью Google translate |
||
МЕНЮ Искусственный интеллект Поиск Регистрация на сайте Помощь проекту ТЕМЫ Новости ИИ Искусственный интеллект Разработка ИИГолосовой помощник Городские сумасшедшие ИИ в медицине ИИ проекты Искусственные нейросети Слежка за людьми Угроза ИИ ИИ теория Внедрение ИИКомпьютерные науки Машинное обуч. (Ошибки) Машинное обучение Машинный перевод Реализация ИИ Реализация нейросетей Создание беспилотных авто Трезво про ИИ Философия ИИ Big data Работа разума и сознаниеМодель мозгаРобототехника, БПЛАТрансгуманизмОбработка текстаТеория эволюцииДополненная реальностьЖелезоКиберугрозыНаучный мирИТ индустрияРазработка ПОТеория информацииМатематикаЦифровая экономика
Генетические алгоритмы Капсульные нейросети Основы нейронных сетей Распознавание лиц Распознавание образов Распознавание речи Техническое зрение Чат-боты Авторизация |
2018-05-20 23:18
Обычно Google translate используют для перевода речи транслируемой микрофоном. Но в один момент, автору потребовалось перевести подкаст Медузы в текст. Идея лежала на поверхности и наверняка программы для этого должны были присутствовать. Так -же как сделано в Gogle translate. Но, гуглением, программы не нашлось, кроме двух сайтов. Которые использовали по уверениям их авторов всю мощь искусственного интеллекта Google. Первый нашелся русскоязычный сайт https://speechpad.ru/blog/windows-integration/ Но, как бы не было обидно, магия не сработала... Был найден англоязычный сайт: https://speechlogger.appspot.com/ru/ Результат — тот же. Но, было в отличие от предыдущего — объяснение. Там было показано, как реализовать, казалось бы, простую идею: пустить в качестве сигнала микрофона — аудио файл. Для этого необходим драйвер VB-CABLE Virtual Audio Device Он OpenSourse. Искренняя благодарность "прогнившим западным" альтруистам! Устанавливаем (проверено под Win 10) и настраиваем микрофонный вход в системе, на этот драйвер. Открываем Gogle translate, нажимаем кнопочку с изображением микрофона и запускаем любой плейер с аудио — файлом. И — Вааля! Магия работает, на ваших глазах появляются строки текста. Точность распознавания, на глаз 85-97 %. Но, есть ограничение — 5 тыс. символов, что немало. Поэтому приходиться останавливать запись, копировать текст и продолжать далее. Заодно происходит перевод на второй выбранный язык. О боже, сколько странных переводов появится! Дополнение: есть способ без ограничений на количество символов. — это Google Docs, он так-же работает но, только без перевода на второй язык. Спасибо dioneo Как мне кажется, Google блокирует постоянные подключения с одних IP. Поэтому ценность этого способа — в том, что все IP не заблокируешь и соответственно, этот способ более работоспособен. Тут уже слово разработчикам и большим "гуру", чем автор. Всем добра и удобства. Источник: geektimes.com Комментарии: |
|