Как искусственный интеллект помогает в работе функции «Привет, Siri»

МЕНЮ


Искусственный интеллект
Поиск
Регистрация на сайте
Помощь проекту

ТЕМЫ


Новости ИИРазработка ИИВнедрение ИИРабота разума и сознаниеМодель мозгаРобототехника, БПЛАТрансгуманизмОбработка текстаТеория эволюцииДополненная реальностьЖелезоКиберугрозыНаучный мирИТ индустрияРазработка ПОТеория информацииМатематикаЦифровая экономика

Авторизация



RSS


RSS новости


Мы уже рассказывали о журнале компании Apple, в котором она публикует свои наработки в области искусственного интеллекта. В журнале уже есть несколько публикаций, и все они не слишком просты для понимания, если, конечно, вы сами не занимаетесь разработками в сфере машинного обучения. В новой публикации много сложностей, но есть и вещи, понятные обывателю. Она посвящена работе функции «Привет, Siri».

Публикация помогает понять, что происходит в вашем iPhone, когда вы говорите «Привет, Siri». Существует этап анализа звукового спектра, на котором звуковые волны преобразуются в кадры по 0,01 секунды. Около 20 таких кадров совмещаются с акустической моделью. DNN (Deep Neural Network) по каждому из звуковых кадров оценивает вероятность воспроизведения тех, которые используются при проговаривании фразы «Привет, Siri». Помимо этого класса кадров существует молчание и другая речь. Всего их около 20.

В сложных звуковых условиях работает система, которая упрощает запуск Siri, но предотвращает ложные срабатывания. Для срабатывания функции существует высший порог, низший порог и нормальный порог. Siri активируется лишь при достижении высшего порога. При понимании того, что событие случилось в нормальном пороге, система переключается на более чувствительный режим работы. Это позволяет пользователю активировать ассистента, сказав «Привет, Siri» повторно, не прикладывая больше усилий.

Описанный выше подход позволяет повысить удобство использования функции, но не увеличивает количество ложных срабатываний, так как система находится в такой настройке очень короткое время.

Кроме того, публикация объяснила, что функция «Привет, Siri» срабатывает на часах Apple Watch только тогда, когда сопроцессор движения определяет жест поднятия руки. В этот момент часы выполняют большую работу. Им необходимо отобразить всю информацию на экране. На распознавание фразы «Привет, Siri» отводится около 5 процентов вычислительной мощности.

Комментарии: