Одной из ключевых фишек Google Pixel 4 стал встроенный транскрибатор, способный с помощью искусственного интеллекта преобразовывать речь в текст. Журналисты издания The Wall Street Journal решили проверить, как справляется флагман с записью разных носителей языка, акцентами и быстрой речью.
Задачей Pixel 4 было преобразование речи людей в текст. Данная функция появилась в стандартном приложении «Диктофон» и, по заверению Google, работает намного лучше большинства специализированных программ благодаря взаимодействию с нейронными сетями. При этом транскрибация на Google Pixel 4 работает даже при отключённом интернете. Все необходимые для работы технологии библиотеки хранятся внутри устройства.
Главным оппонентом смартфона стала стенографистка с многолетним стажем, способная набирать до 260 слов в минуту. Алгоритм без проблем разобрал речь автора эксперимента Джанны Стерн, кое-где даже расставив знаки пунктуации. Следующим испытанием для Pixel 4 стала запись голоса самой быстроговорящей женщины в мире Фрэн Капо, попавшей в Книгу рекордов Гиннесса.
В отличие от стенографистки, алгоритм Google не понял практически ни слова из первого фрагмента сказки о «Трёх поросёнках», но относительно неплохо справился с преобразованием отрывка из «Гамлета» Шекспира.
Для проверки качества распознавания приложением акцентов были приглашены четыре человека из Новой Зеландии, Ирландии, Ямайки и Германии. Смартфон сумел распознать речь каждого, но часто допускал ошибки. Тем не менее авторы исследования отметили, что возможности транскрибации Pixel 4 впечатляют.