Имитация голоса — уже реальность

2018-04-12 22:30

кибер безопасность, искусственный интеллект

Компания Baidu, которую нередко называют «китайским Google», в прошлом месяце опубликовала технический документ, в котором рассказывается о последних наработках в сфере искусственного интеллекта (ИИ). Система, работающая на базе нейронной сети, способна клонировать человеческий голос на основе анализа даже очень короткого фрагмента исходного материала. Программа не только весьма неплохо имитирует человеческую речь, но ещё и способна вносить в неё свои особенности вроде акцента.

Предыдущие версии данной технологии позволяли создавать имитацию человеческой речи на основе анализа более продолжительных образцов. В 2017 году команда инженеров из Baidu Deep Voice представила технологию, способную имитировать речь человека на основе 30-минутного исходного материала. Конкурентные разработки в этой сфере, в свою очередь, справлялись несколько быстрее. Например, программа VoCo от компании Adobe могла имитировать человеческую речь на основе всего 20-минутного демо. А разработка Lyrebird канадского стартапа демонстрировала ещё более удивительную возможность — ей хватало всего минуты оригинального семпла человеческого голоса, чтобы создать его имитацию. Новая же разработка Baidu пошла ещё дальше — ей достаточно всего лишь нескольких секунд исходного материала.

На первый взгляд может показаться, что в подобных технологиях нет никакой практической пользы — так, одно баловство. Но это большое заблуждение. В будущем эти технологии определённо найдут свою сферу использования. Представьте себе человека, утратившего возможность говорить и вновь её обрётшего, пусть даже и посредством машины. Или неспокойного ребёнка, не желающего ложиться в кровать, пока не услышит вашего голоса, читающего сказку, в то время как вы находитесь очень далеко и у вас просто нет физической возможности ему позвонить. Это лишь самая незначительная часть тех возможностей, которые могут открыться перед этой технологией.

Помимо этого, данная технология может использоваться, например, для создания персонализированных цифровых ассистентов, способных разговаривать с вами настоящим человеческим, а не компьютерным голосом.

Но, как и у любой другой технологии, здесь тоже есть обратная сторона медали. Мы можем столкнуться с её злоупотреблением и использованием в не совсем законных целях. Портал New Scientist сообщает, что текущая версия программы смогла создать один тип голоса, который при проверке системой распознавания голоса в 95 процентах случаев смог её обмануть. А люди так вообще оценили качество клонированных образцов на 3,16 балла из 4. Такими темпами рано или поздно мы можем столкнуться со случаями мошенничества с использованием искусственного интеллекта, отмечают журналисты.

В мире уже существуют программы, которые при помощи нейронных сетей способны изменять или даже имитировать человеческие лица на видео. Например, сейчас интернет захлестнула волна порнороликов, в которых лица моделей заменяются на лица знаменитостей. Конечно, всё это выглядит пока лишь обычной шалостью, но в скором времени, в сочетании с технологией, способной очень точно имитировать тот или иной голос, мы можем столкнуться с очередной волной «фейковых новостей», в которых видные деятели из различных сфер и политики будут говорить те вещи, которые они никогда бы не сказали на самом деле.

В 2016 году один из крупнейших банков Великобритании, Barclays, ввёл возможность голосовой аутентификации для всех своих частных клиентов. Использовать идентификацию по голосу вместо пароля предлагает своим клиентам и международная финансовая организация HSBC. Клиент должен позвонить в банк, пройти классическую аутентификацию по кодовому слову и произнести несколько раз предложение «Мой голос — мой пароль» (My voice is my password). В следующий раз для доступа к счетам ему будет достаточно произнести эту фразу. HSBC утверждает, что система защищена от попыток злоумышленников подсунуть ей запись голоса клиента. Дескать, технология Voice Biometrics создаёт «отпечаток голоса», который распознает физические и поведенческие нюансы речи. Однако неизвестно, как эти системы реагируют на новые технологии.

Возможно, вскоре вместо отправки сообщений от «сына/дочки/внучки...» с просьбой положить денег злоумышленники будут просто звонить вам или сразу в банк, склонировав голос с какой-нибудь записи из сети.

Использованные материалы:

hi-news.ru/technology/baidu-sozdala-programmu-sposobnuyu-klonirovat-vash-golos-za-neskolko-sekund.html;

kaspersky.ru/blog/synthetic-voice-phone-fraud/18521.

Телеграм: t.me/ainewsline

Источник: vk.com



		Имитация голоса — уже реальность
МЕНЮ Главная страница Поиск Регистрация на сайте Помощь проекту Архив новостей ТЕМЫ Новости ИИ Голосовой помощник Городские сумасшедшие ИИ в медицине ИИ проекты Искусственные нейросети Искусственный интеллект Слежка за людьми Угроза ИИ Разработка ИИ Атаки на ИИ ИИ теория Компьютерные науки Машинное обуч. (Ошибки) Машинное обучение Машинный перевод Нейронные сети начинающим Психология ИИ Реализация ИИ Реализация нейросетей Создание беспилотных авто Трезво про ИИ Философия ИИ Внедрение ИИ Big data Генетические алгоритмы Капсульные нейросети Основы нейронных сетей Промпты. Генеративные запросы Распознавание лиц Распознавание образов Распознавание речи Творчество ИИ Техническое зрение Чат-боты Работа разума и сознание Изучение сна Изучение сознания Нейроинтерфейс Психология Работа мозга Работа памяти Работа разума Модель мозга Модель мозга Робототехника, БПЛА Беспилотные автомобили БПЛА Робототехника Трансгуманизм Трансгуманизм Обработка текста Анализ социальных сетей Компьютерная лингвистика Лингвистика Поисковые алгоритмы Теория эволюции Головной мозг Нейронные сети Поведение животных Теория эволюции Дополненная реальность Виртулаьная реальность Дополненная реальность Железо Интернет вещей Квантовый компьютер Нейронные процессоры облачные вычисления Суперкомпьютеры Киберугрозы Кибербезопасность Научный мир Методы исследования Наука и образование Семинары ИТ индустрия ИТ-гиганты Новости ит Разработка ПО Разработка ПО Теория алгоритмов Теория информации Кластеризация Математика Актуальная математика Статистика Теория вероятности Теория информации Теория хаоса Цифровая экономика Технология блокчейн Цифровая экономика Авторизация RSS RSS новости		2018-04-12 22:30 кибер безопасность, искусственный интеллект Компания Baidu, которую нередко называют «китайским Google», в прошлом месяце опубликовала технический документ, в котором рассказывается о последних наработках в сфере искусственного интеллекта (ИИ). Система, работающая на базе нейронной сети, способна клонировать человеческий голос на основе анализа даже очень короткого фрагмента исходного материала. Программа не только весьма неплохо имитирует человеческую речь, но ещё и способна вносить в неё свои особенности вроде акцента. Предыдущие версии данной технологии позволяли создавать имитацию человеческой речи на основе анализа более продолжительных образцов. В 2017 году команда инженеров из Baidu Deep Voice представила технологию, способную имитировать речь человека на основе 30-минутного исходного материала. Конкурентные разработки в этой сфере, в свою очередь, справлялись несколько быстрее. Например, программа VoCo от компании Adobe могла имитировать человеческую речь на основе всего 20-минутного демо. А разработка Lyrebird канадского стартапа демонстрировала ещё более удивительную возможность — ей хватало всего минуты оригинального семпла человеческого голоса, чтобы создать его имитацию. Новая же разработка Baidu пошла ещё дальше — ей достаточно всего лишь нескольких секунд исходного материала. На первый взгляд может показаться, что в подобных технологиях нет никакой практической пользы — так, одно баловство. Но это большое заблуждение. В будущем эти технологии определённо найдут свою сферу использования. Представьте себе человека, утратившего возможность говорить и вновь её обрётшего, пусть даже и посредством машины. Или неспокойного ребёнка, не желающего ложиться в кровать, пока не услышит вашего голоса, читающего сказку, в то время как вы находитесь очень далеко и у вас просто нет физической возможности ему позвонить. Это лишь самая незначительная часть тех возможностей, которые могут открыться перед этой технологией. Помимо этого, данная технология может использоваться, например, для создания персонализированных цифровых ассистентов, способных разговаривать с вами настоящим человеческим, а не компьютерным голосом. Но, как и у любой другой технологии, здесь тоже есть обратная сторона медали. Мы можем столкнуться с её злоупотреблением и использованием в не совсем законных целях. Портал New Scientist сообщает, что текущая версия программы смогла создать один тип голоса, который при проверке системой распознавания голоса в 95 процентах случаев смог её обмануть. А люди так вообще оценили качество клонированных образцов на 3,16 балла из 4. Такими темпами рано или поздно мы можем столкнуться со случаями мошенничества с использованием искусственного интеллекта, отмечают журналисты. В мире уже существуют программы, которые при помощи нейронных сетей способны изменять или даже имитировать человеческие лица на видео. Например, сейчас интернет захлестнула волна порнороликов, в которых лица моделей заменяются на лица знаменитостей. Конечно, всё это выглядит пока лишь обычной шалостью, но в скором времени, в сочетании с технологией, способной очень точно имитировать тот или иной голос, мы можем столкнуться с очередной волной «фейковых новостей», в которых видные деятели из различных сфер и политики будут говорить те вещи, которые они никогда бы не сказали на самом деле. В 2016 году один из крупнейших банков Великобритании, Barclays, ввёл возможность голосовой аутентификации для всех своих частных клиентов. Использовать идентификацию по голосу вместо пароля предлагает своим клиентам и международная финансовая организация HSBC. Клиент должен позвонить в банк, пройти классическую аутентификацию по кодовому слову и произнести несколько раз предложение «Мой голос — мой пароль» (My voice is my password). В следующий раз для доступа к счетам ему будет достаточно произнести эту фразу. HSBC утверждает, что система защищена от попыток злоумышленников подсунуть ей запись голоса клиента. Дескать, технология Voice Biometrics создаёт «отпечаток голоса», который распознает физические и поведенческие нюансы речи. Однако неизвестно, как эти системы реагируют на новые технологии. Возможно, вскоре вместо отправки сообщений от «сына/дочки/внучки...» с просьбой положить денег злоумышленники будут просто звонить вам или сразу в банк, склонировав голос с какой-нибудь записи из сети. Использованные материалы: hi-news.ru/technology/baidu-sozdala-programmu-sposobnuyu-klonirovat-vash-golos-za-neskolko-sekund.html; kaspersky.ru/blog/synthetic-voice-phone-fraud/18521. Телеграм: t.me/ainewsline Источник: vk.com Комментарии:

Имитация голоса — уже реальность

Комментарии: