«Задача распознавания речи будет решена: даже в самых сложных условиях системы будут работать на уровне человека или лучше, количество внедрений лицевой и голосовой биометрии кратно увеличится», —

МЕНЮ


Главная страница
Поиск
Регистрация на сайте
Помощь проекту
Архив новостей

ТЕМЫ


Новости ИИРазработка ИИВнедрение ИИРабота разума и сознаниеМодель мозгаРобототехника, БПЛАТрансгуманизмОбработка текстаТеория эволюцииДополненная реальностьЖелезоКиберугрозыНаучный мирИТ индустрияРазработка ПОТеория информацииМатематикаЦифровая экономика

Авторизация



RSS


RSS новости


2021-02-01 14:20

ит новости

«Задача распознавания речи будет решена: даже в самых сложных условиях системы будут работать на уровне человека или лучше, количество внедрений лицевой и голосовой биометрии кратно увеличится», — считает Дмитрий Дырмовский, генеральный директор группы ЦРТ, которая вошла в ТОП-5 крупных компаний рейтинга «ТехУспех-2020».

Группа ЦРТ — глобальный разработчик продуктов и решений на основе интеллектуальных речевых технологий, распознавания лиц, эксперт в области машинного обучения. ЦРТ — одна из немногих компаний в мире, которая развивает обе биометрические модальности — голос и лицо, что позволяет ей конкурировать в создании комплексных решений. В багаже группы — уже более 5000 реализованных проектов с применением искусственного интеллекта в 70 странах.

С Дмитрием Дырмовским мы поговорили о трендах рынка распознавания речи и задачах, которые решает бизнес с помощью AI-продуктов.

Чем решения вашей компании отличаются от аналогов?

— У нас широкий продуктовый портфель, и каждый продукт имеет свои отличия. К примеру, в группе наших решений используется технология распознавания речи, признанная на международном конкурсе CHiME-2020 лучшей в мире, а наш синтез речи едва отличим от речи живого человека. Эффективность оценивают заказчики: группа ЦРТ стала преферентным поставщиком биометрических и речевых решений для банков; и это один из примеров.

Какие есть тренды на рынке распознавания речи и лиц?

— Все больше бизнесов уходит в онлайн, больше услуг потребляется дистанционно, что ускорит и увеличит количество внедрений роботизированных помощников. Из трендов лицевой биометрии — рост внедрений не только в сфере безопасности, но и в сфере умных решений: биометрические проходы в аэропорты, на стадионы, оплата улыбкой.

Среди технологических трендов распознавания речи:

• миграция технологий из колл-центров в открытые пространства: офисы и даже на улицы;

• запрос на задачу распознавания «речевого коктейля»: перебивания, наложения речи, сложные акустические условия, спонтанная речь нескольких дикторов;

• работа систем в реальном времени, которые будут аккумулировать информацию в больших базах, формируя качественно новые данные для анализа;

• рост популярности виртуальных помощников и аватаров.

У каких голосовых роботов будут преимущества?

— Что касается самих роботов, то преимущества будут у тех, которые смогут вести диалог на естественном языке, что повлечет развитие технологий синтеза речи. Синтез речи станет неотличим от голоса реального человека: и в особенностях произношения, и, что самое главное — в эмоциях. Будут совершенствоваться механизмы управления голосом: дыхание, интонация ударения; появится возможность создавать полноценные голоса на малом количестве данных. Все это в фокусе группы ЦРТ.

Как пандемия повлияла на выбор направлений или палитру запросов на разработки?

— Пандемия стала драйвером AI-решений. В целом отмечается повышение спроса на интеллектуальных ассистентов, голосовых и текстовых роботов для улучшения клиентского опыта.

Решения ЦРТ применяются в таких секторах экономики, как:

•? Медицина. Особо актуальным оказался продукт Voice2Med, который преобразует голос врача в текст и позволяет заполнять медицинские протоколы голосом.

•? Безопасность. Биометрическая система распознавания лиц, которая раньше применялась для безопасности и комфорта, в период пандемии – для минимизации контактов и в кейсе заботы о здоровье. Дистанционная активность спровоцировала развитие «цифровых аватаров», а для аутентификации и верификации все чаще стала использоваться мультимодальная биометрия.

•? Финансы, телеком, e-commerce и других отраслях стал отчетливее тренд омниканальной аналитики и клиентоцентричности. Добиться этого позволяют реализовать решения речевой аналитики, развивая бизнес, «слыша голос» клиента, понимая его потребности и онлайн, и офлайн.

Есть ли среди ваших разработок те, что оказались в нужное время в нужном месте?

— В начале пандемии мы помогли Райффайзенбанку среагировать на рост обращений на горячую линию: выявляли тренды причин обращений, адаптировали ответы текстового робота для наиболее эффективной работы с входящими обращениями. Уже в марте 2020 года каждое третье обращение с участием робота Райффайзенбанк закрыл полностью автоматически, без привлечения оператора.

В проекте для Forte Bank (Казахстан) решение ЦРТ работало с билингвальным (двуязычным) обслуживанием — на русском и казахском языках. Результаты и эффективность оценивали в операционных показателях контакт-центра: повторные обращения снизились на 18%, среднее время обслуживания сократилось на 13%, а показатели выполнения стандартов обслуживания выросли в 4 раза.

Рейтинг «ТехУспех» формируется ежегодно с 2012 года и нацелен на поиск, мониторинг и продвижение перспективных быстрорастущих технологических компаний, которые обладают высоким потенциалом лидерства как на российском, так и на глобальном рынках.

www.ratingtechup.ru


Источник: vk.com

Комментарии: