Цена слова: можно ли защитить свой голосовой отпечаток

МЕНЮ


Главная страница
Поиск
Регистрация на сайте
Помощь проекту
Архив новостей

ТЕМЫ


Новости ИИРазработка ИИВнедрение ИИРабота разума и сознаниеМодель мозгаРобототехника, БПЛАТрансгуманизмОбработка текстаТеория эволюцииДополненная реальностьЖелезоКиберугрозыНаучный мирИТ индустрияРазработка ПОТеория информацииМатематикаЦифровая экономика

Авторизация



RSS


RSS новости


Распознавание голоса — и сбор данных — в последние годы пережили настоящий бум. Исследователи выясняют, как защитить вашу частную жизнь.

Ваш голос раскрывает о вас больше, чем вы думаете. Например, для человеческого уха ваш голос может мгновенно выдать ваше настроение — легко определить, взволнованы вы или расстроены. Но машины могут узнать гораздо больше: определить ваш возраст, пол, этническую принадлежность, социально-экономический статус, состояние здоровья и многое другое. Исследователи даже смогли генерировать изображения лиц на основе информации, содержащейся в голосовых данных людей.

По мере того как машины становятся лучше понимать вас по вашему голосу, компании получают прибыль. Системы распознавания голоса — от Siri и Alexa до тех, которые используют ваш голос в качестве пароля, — получили широкое распространение в последние годы, поскольку искусственный интеллект и машинное обучение открыли возможность понимать не только то, что вы говорите, но и то, кто вы есть. Большой голос может стать индустрией стоимостью 20 миллиардов долларов в течение нескольких лет. И по мере роста рынка исследователи, ориентированные на конфиденциальность, все чаще ищут способы защитить людей от использования их голосовых данных против них.

Громкие Угрозы

Как слова, которые вы произносите, так и то, как вы их произносите, могут быть использованы для идентификации вас, говорит Эммануэль Винсент, старший научный сотрудник, специализирующийся на голосовых технологиях во французском Национальном институте исследований в области цифровой науки и технологий (Inria), но это только начало. “Вы также найдете другую информацию о своих эмоциях или состоянии здоровья”, - говорит Винсент.

“Эти дополнительные фрагменты информации помогают создать более полный профиль — тогда это можно было бы использовать для всех видов целевой рекламы”, - говорит Винсент. Помимо того, что ваши голосовые данные потенциально попадают в обширную область данных, используемых для показа вам онлайн-рекламы, существует также риск того, что хакеры могут получить доступ к местоположению, где хранятся ваши голосовые данные, и использовать их для того, чтобы выдавать себя за вас. Небольшое количество подобных случаев клонирования уже произошло, что доказывает ценность вашего голоса. Простые мошенники с робозвонками также фиксировали людей, говорящих “да”, чтобы использовать подтверждение в мошенничестве с платежами.

В прошлом году TikTok изменил свою политику конфиденциальности и начал собирать голосовые отпечатки — свободный термин для обозначения данных, содержащихся в вашем голосе, — людей в США наряду с другими биометрическими данными, такими как отпечаток вашего лица. В более широком смысле колл-центры используют искусственный интеллект для анализа “поведения и эмоций” людей во время телефонных звонков и оценки “тона, темпа и высоты каждого отдельного слова” для разработки профилей людей и увеличения продаж. “Мы почти в ситуации, когда системы, позволяющие распознать, кто вы есть, и связать все воедино, существуют, но защиты нет — и она все еще довольно далека от того, чтобы ее можно было легко использовать”, - говорит Генри Тернер, который исследовал безопасность голосовых систем в Оксфордском университете.

Скрытый Смысл

Ваш голос вырабатывается в результате сложного процесса, включающего легкие и ваш голосовой аппарат, горло, нос, рот и придаточные пазухи. По словам Ребекки Кляйнбергер, исследователя голоса в MIT Media Lab, когда вы говорите, активируется более сотни мышц. “Это также в значительной степени мозг”, - говорит Кляйнбергер.

Исследователи экспериментируют с четырьмя способами повышения конфиденциальности вашего голоса, говорит Наталья Томашенко, исследователь из Авиньонского университета, Франция, которая изучает голос и является первым автором исследовательской работы по результатам инженерной задачи обеспечения конфиденциальности голоса. Ни один из методов не идеален, но они изучаются как возможные способы повышения конфиденциальности в инфраструктуре, обрабатывающей ваши голосовые данные.

Первый - это запутывание, которое пытается полностью скрыть, кто является говорящим. Подумайте о голливудском изображении хакера, полностью искажающего свой голос во время телефонного разговора, когда он объясняет дьявольский заговор или требование выкупа (или рекламные ролики хактивистского коллектива Anonymous). Простое оборудование для изменения голоса позволяет любому быстро изменить звучание своего голоса. Более продвинутые системы преобразования речи в текст могут транскрибировать то, что вы говорите, а затем повернуть процесс вспять и произнести это новым голосом.
самый популярный

Во—вторых, по словам Томашенко, исследователи рассматривают распределенное и федеративное обучение - когда ваши данные не покидают ваше устройство, но модели машинного обучения все равно учатся распознавать речь, делясь своим обучением с более крупной системой. Другой подход предполагает создание зашифрованной инфраструктуры для защиты голосов людей от слежки.

Однако большинство усилий сосредоточено на анонимизации голоса.

Анонимизация направлена на то, чтобы ваш голос звучал по-человечески, одновременно удаляя как можно больше информации, которая могла бы быть использована для вашей идентификации. Усилия по анонимизации речи в настоящее время включают два отдельных направления: анонимизацию содержания того, что кто-то говорит, удаляя или заменяя любые конфиденциальные слова в файлах перед их сохранением, и анонимизацию самого голоса. Большинство попыток анонимизации голоса на данный момент связаны с передачей чьего-либо голоса через экспериментальное программное обеспечение, которое изменит некоторые параметры голосового сигнала, чтобы он звучал по-другому. Это может включать изменение высоты тона, замену сегментов речи информацией из других голосов и синтезирование конечного результата.

Работает ли технология анонимизации? Мужские и женские голосовые клипы, которые были анонимизированы в рамках программы Voice Privacy Challenge в 2020 году, определенно звучат по-разному. Они более роботизированы, звучат немного болезненно и могут — по крайней мере, для некоторых слушателей — принадлежать другому человеку, чем оригинальные голосовые клипы. “Я думаю, что это уже может гарантировать гораздо более высокий уровень защиты, чем бездействие, которое является текущим статусом”, - говорит Винсент, который смог снизить сложность идентификации людей в исследованиях анонимизации. Однако люди - не единственные слушатели. Рита Сингх, доцент Института языковых технологий Университета Карнеги-Меллон, говорит, что полная деидентификация голосового сигнала невозможна, поскольку у машин всегда будет потенциал для установления связей между атрибутами и отдельными лицами, даже связей, которые не понятны людям. “Относится ли анонимизация к слушателю-человеку или к слушателю-машине?” - говорит Шри Нараянан, профессор электротехники и вычислительной техники в Университете Южной Калифорнии.

“Настоящая анонимизация невозможна без полного изменения голоса”, - говорит Сингх. “Когда вы полностью меняете голос, тогда это уже не тот голос”. Несмотря на это, по-прежнему стоит развивать технологию защиты голоса, добавляет Сингх, поскольку ни одна система конфиденциальности или безопасности не является полностью безопасной. Отпечатки пальцев и системы идентификации лиц на iPhone в прошлом подделывались, но в целом они по-прежнему являются эффективным методом защиты частной жизни людей.

Пока, Алекса

Ваш голос все чаще используется как способ подтверждения вашей личности. Например, все большее число банков и других компаний анализируют ваши голосовые отпечатки с вашего разрешения, чтобы заменить ваш пароль. Существует также потенциал анализа голоса для выявления болезни до того, как другие признаки станут очевидными. Но технология клонирования или подделки чьего-либо голоса быстро развивается.

Если у вас есть несколько минут записи чьего—либо голоса, а в некоторых случаях и несколько секунд, этот голос можно воссоздать с помощью машинного обучения - например, актеров озвучки Симпсонов можно заменить глубокими фальшивыми голосовыми клонами. А коммерческие инструменты для воссоздания голосов легко доступны в Интернете. “Определенно, предстоит больше работы по идентификации говорящего и преобразованию речи в текст и текста в речь, чем по защите людей от любой из этих технологий”, - говорит Тернер.

Многие из методов анонимизации голоса, разрабатываемых в настоящее время, все еще далеки от использования в реальном мире. Когда они будут готовы к использованию, вполне вероятно, что компаниям придется самим внедрять инструменты для защиты конфиденциальности своих клиентов — в настоящее время частные лица мало что могут сделать, чтобы защитить свой собственный голос. Отказ от звонков в колл-центры или компании, которые используют анализ голоса, и отказ от использования голосовых помощников может ограничить объем записи вашего голоса и уменьшить возможные возможности атаки.

Но самая большая защита может исходить от судебных дел и мер защиты. Европейский GDPR охватывает биометрические данные, включая голоса людей, в рамках своей защиты конфиденциальности. В руководящих принципах говорится, что людям следует сообщать, как используются их данные, и давать согласие, если их идентифицируют, и что следует ввести некоторые ограничения на персонализацию. Тем временем в США суды штата Иллинойс, где действуют одни из самых строгих биометрических законов в стране, все чаще рассматривают дела, связанные с голосовыми данными людей. McDonald's, Amazon и Google сталкиваются с судебным контролем за тем, как они используют голосовые данные людей. Решения по этим делам могли бы установить новые правила защиты голосов людей.


Источник: www.wired.com

Комментарии: