Google продвинулся в обучении компьютера человеческой речи |
||
МЕНЮ Искусственный интеллект Поиск Регистрация на сайте Помощь проекту Архив новостей ТЕМЫ Новости ИИ Искусственный интеллект Разработка ИИГолосовой помощник Городские сумасшедшие ИИ в медицине ИИ проекты Искусственные нейросети Слежка за людьми Угроза ИИ ИИ теория Внедрение ИИКомпьютерные науки Машинное обуч. (Ошибки) Машинное обучение Машинный перевод Нейронные сети начинающим Реализация ИИ Реализация нейросетей Создание беспилотных авто Трезво про ИИ Философия ИИ Big data Работа разума и сознаниеМодель мозгаРобототехника, БПЛАТрансгуманизмОбработка текстаТеория эволюцииДополненная реальностьЖелезоКиберугрозыНаучный мирИТ индустрияРазработка ПОТеория информацииМатематикаЦифровая экономика
Генетические алгоритмы Капсульные нейросети Основы нейронных сетей Распознавание лиц Распознавание образов Распознавание речи Техническое зрение Чат-боты Авторизация |
2016-09-09 18:35 Принадлежащая Google британская компания DeepMind на своем сайте сообщила, что добилась значительного прогресса в разработке генерируемой компьютером речи. Это означает, что потенциально приближается тот день, когда машины заговорят «по-человечески». Разработчики из DeepMind считают, что разрабатываемая ими технология позволит существенно сократить разрыв между естественной человеческой речью и создаваемой современными компьютерными системами. Технология, получившая название WaveNet, способна генерировать речь, которая имитирует любой человеческий голос и звучит естественнее, чем лучшие из существующих систем перевода письменного текста в речь, утверждается на сайте компании. Разработчики DeepMind также протестировали систему с музыкой, позволяющую генерировать короткие композиции на фортепиано на основе анализа классической музыки. По словам одного из источников FT, технология на данный момент не используется ни в одном из продуктов Google, тем не менее, она может быть использована в будущем. WaveNet отличается от существующих искусственных «синтезаторов речи» тем, что в ней фактически воспроизводятся звуковые волны. Использование так называемой нейронной сети, технологии, которая пытается имитировать человеческий мозг, позволяет анализировать исходные формы звуковых волны и проектировать вероятные модели. Этот подход отличается от принципа работы большинства существующих систем преобразования текста в речь, которые, используя аудиозаписи человеческого голоса, воспроизводят звуки, основанные на введенных данных, продолжает FT. В технологии WaveNet речь идет о том, чтобы синтезировать речь, аналогичную человеческой. «Позволить людям общаться с машинами - это давняя мечта взаимодействия человека с компьютером», - отмечается на сайте DeepMind. Базирующаяся в Лондоне компания DeepMind специализируется на разработках в сфере искусственного интеллекта. В 2014 году ее приобрела американская корпорация Google. Сумма сделки не раскрывалась. FT со ссылкой на источник писала, что Google заплатила S400 млн. DeepMind привлекла к себе внимание весной 2016 года, когда стало известно о создании системы, обыгравшей чемпиона мира по игре в «Го». Источник: it-news.club Комментарии: |
|