Как искусственный интеллект помогает в работе функции «Привет, Siri» |
||
МЕНЮ Искусственный интеллект Поиск Регистрация на сайте Помощь проекту ТЕМЫ Новости ИИ Искусственный интеллект Разработка ИИГолосовой помощник Городские сумасшедшие ИИ в медицине ИИ проекты Искусственные нейросети Слежка за людьми Угроза ИИ ИИ теория Внедрение ИИКомпьютерные науки Машинное обуч. (Ошибки) Машинное обучение Машинный перевод Реализация ИИ Реализация нейросетей Создание беспилотных авто Трезво про ИИ Философия ИИ Big data Работа разума и сознаниеМодель мозгаРобототехника, БПЛАТрансгуманизмОбработка текстаТеория эволюцииДополненная реальностьЖелезоКиберугрозыНаучный мирИТ индустрияРазработка ПОТеория информацииМатематикаЦифровая экономика
Генетические алгоритмы Капсульные нейросети Основы нейронных сетей Распознавание лиц Распознавание образов Распознавание речи Техническое зрение Чат-боты Авторизация |
2017-10-22 14:47 Мы уже рассказывали о журнале компании Apple, в котором она публикует свои наработки в области искусственного интеллекта. В журнале уже есть несколько публикаций, и все они не слишком просты для понимания, если, конечно, вы сами не занимаетесь разработками в сфере машинного обучения. В новой публикации много сложностей, но есть и вещи, понятные обывателю. Она посвящена работе функции «Привет, Siri». Публикация помогает понять, что происходит в вашем iPhone, когда вы говорите «Привет, Siri». Существует этап анализа звукового спектра, на котором звуковые волны преобразуются в кадры по 0,01 секунды. Около 20 таких кадров совмещаются с акустической моделью. DNN (Deep Neural Network) по каждому из звуковых кадров оценивает вероятность воспроизведения тех, которые используются при проговаривании фразы «Привет, Siri». Помимо этого класса кадров существует молчание и другая речь. Всего их около 20. В сложных звуковых условиях работает система, которая упрощает запуск Siri, но предотвращает ложные срабатывания. Для срабатывания функции существует высший порог, низший порог и нормальный порог. Siri активируется лишь при достижении высшего порога. При понимании того, что событие случилось в нормальном пороге, система переключается на более чувствительный режим работы. Это позволяет пользователю активировать ассистента, сказав «Привет, Siri» повторно, не прикладывая больше усилий. Описанный выше подход позволяет повысить удобство использования функции, но не увеличивает количество ложных срабатываний, так как система находится в такой настройке очень короткое время. Кроме того, публикация объяснила, что функция «Привет, Siri» срабатывает на часах Apple Watch только тогда, когда сопроцессор движения определяет жест поднятия руки. В этот момент часы выполняют большую работу. Им необходимо отобразить всю информацию на экране. На распознавание фразы «Привет, Siri» отводится около 5 процентов вычислительной мощности. Комментарии: |
|