Имитация голоса — уже реальность

МЕНЮ


Искусственный интеллект
Поиск
Регистрация на сайте
Помощь проекту

ТЕМЫ


Новости ИИРазработка ИИВнедрение ИИРабота разума и сознаниеМодель мозгаРобототехника, БПЛАТрансгуманизмОбработка текстаТеория эволюцииДополненная реальностьЖелезоКиберугрозыНаучный мирИТ индустрияРазработка ПОТеория информацииМатематикаЦифровая экономика

Авторизация



RSS


RSS новости


Компания Baidu, которую нередко называют «китайским Google», в прошлом месяце опубликовала технический документ, в котором рассказывается о последних наработках в сфере искусственного интеллекта (ИИ). Система, работающая на базе нейронной сети, способна клонировать человеческий голос на основе анализа даже очень короткого фрагмента исходного материала. Программа не только весьма неплохо имитирует человеческую речь, но ещё и способна вносить в неё свои особенности вроде акцента.

Предыдущие версии данной технологии позволяли создавать имитацию человеческой речи на основе анализа более продолжительных образцов. В 2017 году команда инженеров из Baidu Deep Voice представила технологию, способную имитировать речь человека на основе 30-минутного исходного материала. Конкурентные разработки в этой сфере, в свою очередь, справлялись несколько быстрее. Например, программа VoCo от компании Adobe могла имитировать человеческую речь на основе всего 20-минутного демо. А разработка Lyrebird канадского стартапа демонстрировала ещё более удивительную возможность — ей хватало всего минуты оригинального семпла человеческого голоса, чтобы создать его имитацию. Новая же разработка Baidu пошла ещё дальше — ей достаточно всего лишь нескольких секунд исходного материала.

На первый взгляд может показаться, что в подобных технологиях нет никакой практической пользы — так, одно баловство. Но это большое заблуждение. В будущем эти технологии определённо найдут свою сферу использования. Представьте себе человека, утратившего возможность говорить и вновь её обрётшего, пусть даже и посредством машины. Или неспокойного ребёнка, не желающего ложиться в кровать, пока не услышит вашего голоса, читающего сказку, в то время как вы находитесь очень далеко и у вас просто нет физической возможности ему позвонить. Это лишь самая незначительная часть тех возможностей, которые могут открыться перед этой технологией.

Помимо этого, данная технология может использоваться, например, для создания персонализированных цифровых ассистентов, способных разговаривать с вами настоящим человеческим, а не компьютерным голосом.

Но, как и у любой другой технологии, здесь тоже есть обратная сторона медали. Мы можем столкнуться с её злоупотреблением и использованием в не совсем законных целях. Портал New Scientist сообщает, что текущая версия программы смогла создать один тип голоса, который при проверке системой распознавания голоса в 95 процентах случаев смог её обмануть. А люди так вообще оценили качество клонированных образцов на 3,16 балла из 4. Такими темпами рано или поздно мы можем столкнуться со случаями мошенничества с использованием искусственного интеллекта, отмечают журналисты.

В мире уже существуют программы, которые при помощи нейронных сетей способны изменять или даже имитировать человеческие лица на видео. Например, сейчас интернет захлестнула волна порнороликов, в которых лица моделей заменяются на лица знаменитостей. Конечно, всё это выглядит пока лишь обычной шалостью, но в скором времени, в сочетании с технологией, способной очень точно имитировать тот или иной голос, мы можем столкнуться с очередной волной «фейковых новостей», в которых видные деятели из различных сфер и политики будут говорить те вещи, которые они никогда бы не сказали на самом деле.

В 2016 году один из крупнейших банков Великобритании, Barclays, ввёл возможность голосовой аутентификации для всех своих частных клиентов. Использовать идентификацию по голосу вместо пароля предлагает своим клиентам и международная финансовая организация HSBC. Клиент должен позвонить в банк, пройти классическую аутентификацию по кодовому слову и произнести несколько раз предложение «Мой голос — мой пароль» (My voice is my password). В следующий раз для доступа к счетам ему будет достаточно произнести эту фразу. HSBC утверждает, что система защищена от попыток злоумышленников подсунуть ей запись голоса клиента. Дескать, технология Voice Biometrics создаёт «отпечаток голоса», который распознает физические и поведенческие нюансы речи. Однако неизвестно, как эти системы реагируют на новые технологии.

Возможно, вскоре вместо отправки сообщений от «сына/дочки/внучки...» с просьбой положить денег злоумышленники будут просто звонить вам или сразу в банк, склонировав голос с какой-нибудь записи из сети.

Использованные материалы:

hi-news.ru/technology/baidu-sozdala-programmu-sposobnuyu-klonirovat-vash-golos-za-neskolko-sekund.html;

kaspersky.ru/blog/synthetic-voice-phone-fraud/18521.

Комментарии: