«Задача распознавания речи будет решена: даже в самых сложных условиях системы будут работать на уровне человека или лучше, количество внедрений лицевой и голосовой биометрии кратно увеличится», — |
||
МЕНЮ Главная страница Поиск Регистрация на сайте Помощь проекту Архив новостей ТЕМЫ Новости ИИ Голосовой помощник Разработка ИИГородские сумасшедшие ИИ в медицине ИИ проекты Искусственные нейросети Искусственный интеллект Слежка за людьми Угроза ИИ ИИ теория Внедрение ИИКомпьютерные науки Машинное обуч. (Ошибки) Машинное обучение Машинный перевод Нейронные сети начинающим Психология ИИ Реализация ИИ Реализация нейросетей Создание беспилотных авто Трезво про ИИ Философия ИИ Big data Работа разума и сознаниеМодель мозгаРобототехника, БПЛАТрансгуманизмОбработка текстаТеория эволюцииДополненная реальностьЖелезоКиберугрозыНаучный мирИТ индустрияРазработка ПОТеория информацииМатематикаЦифровая экономика
Генетические алгоритмы Капсульные нейросети Основы нейронных сетей Распознавание лиц Распознавание образов Распознавание речи Творчество ИИ Техническое зрение Чат-боты Авторизация |
2021-02-01 14:20 «Задача распознавания речи будет решена: даже в самых сложных условиях системы будут работать на уровне человека или лучше, количество внедрений лицевой и голосовой биометрии кратно увеличится», — считает Дмитрий Дырмовский, генеральный директор группы ЦРТ, которая вошла в ТОП-5 крупных компаний рейтинга «ТехУспех-2020». Группа ЦРТ — глобальный разработчик продуктов и решений на основе интеллектуальных речевых технологий, распознавания лиц, эксперт в области машинного обучения. ЦРТ — одна из немногих компаний в мире, которая развивает обе биометрические модальности — голос и лицо, что позволяет ей конкурировать в создании комплексных решений. В багаже группы — уже более 5000 реализованных проектов с применением искусственного интеллекта в 70 странах. С Дмитрием Дырмовским мы поговорили о трендах рынка распознавания речи и задачах, которые решает бизнес с помощью AI-продуктов. Чем решения вашей компании отличаются от аналогов? — У нас широкий продуктовый портфель, и каждый продукт имеет свои отличия. К примеру, в группе наших решений используется технология распознавания речи, признанная на международном конкурсе CHiME-2020 лучшей в мире, а наш синтез речи едва отличим от речи живого человека. Эффективность оценивают заказчики: группа ЦРТ стала преферентным поставщиком биометрических и речевых решений для банков; и это один из примеров. Какие есть тренды на рынке распознавания речи и лиц? — Все больше бизнесов уходит в онлайн, больше услуг потребляется дистанционно, что ускорит и увеличит количество внедрений роботизированных помощников. Из трендов лицевой биометрии — рост внедрений не только в сфере безопасности, но и в сфере умных решений: биометрические проходы в аэропорты, на стадионы, оплата улыбкой. Среди технологических трендов распознавания речи: • миграция технологий из колл-центров в открытые пространства: офисы и даже на улицы; • запрос на задачу распознавания «речевого коктейля»: перебивания, наложения речи, сложные акустические условия, спонтанная речь нескольких дикторов; • работа систем в реальном времени, которые будут аккумулировать информацию в больших базах, формируя качественно новые данные для анализа; • рост популярности виртуальных помощников и аватаров. У каких голосовых роботов будут преимущества? — Что касается самих роботов, то преимущества будут у тех, которые смогут вести диалог на естественном языке, что повлечет развитие технологий синтеза речи. Синтез речи станет неотличим от голоса реального человека: и в особенностях произношения, и, что самое главное — в эмоциях. Будут совершенствоваться механизмы управления голосом: дыхание, интонация ударения; появится возможность создавать полноценные голоса на малом количестве данных. Все это в фокусе группы ЦРТ. Как пандемия повлияла на выбор направлений или палитру запросов на разработки? — Пандемия стала драйвером AI-решений. В целом отмечается повышение спроса на интеллектуальных ассистентов, голосовых и текстовых роботов для улучшения клиентского опыта. Решения ЦРТ применяются в таких секторах экономики, как: •? Медицина. Особо актуальным оказался продукт Voice2Med, который преобразует голос врача в текст и позволяет заполнять медицинские протоколы голосом. •? Безопасность. Биометрическая система распознавания лиц, которая раньше применялась для безопасности и комфорта, в период пандемии – для минимизации контактов и в кейсе заботы о здоровье. Дистанционная активность спровоцировала развитие «цифровых аватаров», а для аутентификации и верификации все чаще стала использоваться мультимодальная биометрия. •? Финансы, телеком, e-commerce и других отраслях стал отчетливее тренд омниканальной аналитики и клиентоцентричности. Добиться этого позволяют реализовать решения речевой аналитики, развивая бизнес, «слыша голос» клиента, понимая его потребности и онлайн, и офлайн. Есть ли среди ваших разработок те, что оказались в нужное время в нужном месте? — В начале пандемии мы помогли Райффайзенбанку среагировать на рост обращений на горячую линию: выявляли тренды причин обращений, адаптировали ответы текстового робота для наиболее эффективной работы с входящими обращениями. Уже в марте 2020 года каждое третье обращение с участием робота Райффайзенбанк закрыл полностью автоматически, без привлечения оператора. В проекте для Forte Bank (Казахстан) решение ЦРТ работало с билингвальным (двуязычным) обслуживанием — на русском и казахском языках. Результаты и эффективность оценивали в операционных показателях контакт-центра: повторные обращения снизились на 18%, среднее время обслуживания сократилось на 13%, а показатели выполнения стандартов обслуживания выросли в 4 раза. Рейтинг «ТехУспех» формируется ежегодно с 2012 года и нацелен на поиск, мониторинг и продвижение перспективных быстрорастущих технологических компаний, которые обладают высоким потенциалом лидерства как на российском, так и на глобальном рынках. www.ratingtechup.ru Источник: vk.com Комментарии: |
|