|
|
Основатель компании ABBYY - о том, куда движется рынок искусственного интеллекта и почему каждому из нас вскоре придется обзавестись собственной поисковой системой Персональный поисковый ассистент Findo, созданный основателем ABBYY Давидом Яном, на днях получил новые инвестиции в размере $4 млн - от фонда Flint Capital и группы неназванных инвесторов из Кремниевой долины. Давид Ян в беседе с Forbes рассказал, почему каждому из нас вскоре придется обзавестись собственной поисковой системой для того, чтобы упорядочить свою личную информацию, куда движется рынок систем искусственного интеллекта, а также о том, почему борьба за частного потребителя между крупнейшими производителями компьютеров, такими как Apple и Microsoft, - уже пройденный этап в развитии отрасли. Про искусственный интеллект - «В Кремниевой долине сейчас наблюдается совершенно беспрецедентный интерес инвесторов к технологиям искусственного интеллекта и всему, что с ним связано: это глубокое обучение, различные технологии так называемых conversational interfaces, по-русски, видимо, можно назвать их разговорными интерфейсами - это ассистенты, чат-боты. Эти термины звучат на всех конференциях, в статьях, при любом обсуждении, связанном с ИТ-индустрией».
- «Мы в ABBYY давно ведем разработки в области искусственного интеллекта: это технологии распознавания, а также понимания и анализа текстов на естественных языках - наша Compreno. Много лет мы занимались языково-независимой семантической иерархией, то есть описывали устройство мира, создавали дерево понятий. Языки подключаются позже, это листочки нашего дерева. Сейчас у нас листочки на английском и русском, будут и на немецком. Но само ядро знаний не зависит от языка. Такая концепция называется interlingua. По сути мы учим компьютер понимать смысл текста. Для чего это нужно? Например, с нашей помощью банки анализируют информацию о клиентах и сокращают риски при выдаче кредитов, HR-департаменты компаний автоматически извлекают данные о соискателях и быстрее находят нужного кандидата. А службы технической поддержки оперативно отвечают на вопросы клиентов: система анализирует вопросы и сама отправляет их нужному специалисту. Это существенная экономия времени, ведь зачастую речь идет о тысячах вопросов в день. И это лишь некоторые, наиболее бытовые примеры. В свое время, когда мы начинали этим заниматься, было очень много скептиков, которые говорили, что это сделать невозможно. И в какой-то мере они оказались правы. Выяснилось, что возможно, но очень долго и дорого. У нас ушло на это 17 лет и $85 млн. Если бы это делалось в Америке, то стоило бы, наверное, полмиллиарда долларов».
- «Человек использует язык около 300 000 лет, в качестве главного интерфейса для общения. Человек, собственно, стал Homo Sapiens благодаря языку как средству мышления и общения. И только последние 50-60 лет человек не может использовать язык в общении с технологиями и компьютерами. Он вынужден учить птичий компьютерный язык, использовать разные кнопочки, экраны для общения с телевизором, с компьютером, с часами, с пылесосом и так далее. Но все возвращается на круги своя. Как только технологии стали умнее, тут же прорвало. Теперь холодильники начинают общаться на человеческом языке, более того скоро появятся в продаже модели, которые смогут отправить сообщение в Telegram или Facebook Messenger: «Купи помидоры по дороге, у нас кончились помидоры». Пылесос будет сообщать, что у него кончился картридж, а завтра к тебе придут гости. Я знаю компании, которые разрабатывают видеокамеры, способные в видеопотоке распознать агрессивное поведение, людей с оружием в руках, детей, близко подходящих к бассейну, незнакомых людей, стоящих около входа долгое время. И это только начало процесса».
Про персональных ассистентов - «Глубокая нейронная компьютерная сеть откладывает в себе некоторые паттерны, которые она наблюдает. Если говорить о «чистых решениях», где нет модели поведения, это как бы пустой мозг, который накапливает знания. Однако большинство современных систем искусственного интеллекта используют комбинированные решения: они накладывают некоторую заранее предопределенную структуру знаний о предметной области на статистические данные, которым обучается система».
- «Распознавание звукового сигнала - это одна тема. Это превращение звукового сигнала в последовательность символов, слов и предложений. А распознавание в словах и предложениях семантических, лексических объектов, извлечение смысла - это совершенно другая тема. Настоящий conversational interface - это уже ведение диалога. То есть распознавание не только того, что по факту сказано, но и того, что «на самом деле хотел сказать» пользователь. Кто хотел, чего хотел, когда хотел. А потом еще и ответ ему, чаще всего - с уточняющим вопросом. Проблема в том, что пользователь подразумевает, что некая информация должна быть ясна, исходя из контекста и не проговаривает ее компьютеру. То есть, если я говорю умному кондиционеру: «Когда придут гости сделай похолоднее», то кондиционер должен понять, кто такие гости. И хорошо распределить задачу между всеми умными объектами, которые участвуют в управлении температурой. Может быть нужно просто «сказать» отоплению отключиться или окнам открыться».
С точки зрения персональной информационной экосистемы каждый из нас «живет в 1996 году». У большинства людей в личном периметре более 200 000 элементов хранения - писем, файлов, контактов, сообщений. Именно столько в 1996 году было веб-сайтов во всем мире было - около 257 000.
- «И в 1996 году, и сейчас количество данных удваивалось ежегодно. И мы ожидаем, что у каждого из нас через пять лет в личной экосистеме будет больше 10 млн элементов хранения, поиска и обработки (для справки - в 2001 году, через пять лет после 1996 года, в мире было 30 млн сайтов). То есть каждый из нас превращается в информационную микровселенную образца начала 2000 годов. И соответственно, мы уверены, что появится «новый Google», который будет решать задачу каждого из нас для поиска только в нашем личном информационном пространстве. И мы уже более 2 лет создаем такой умный поисковый ассистент».
- «Поисковый ассистент по персональной информации Findo.io, который мы делаем, позволяет находить письма, файлы, контакты по описанию. Когда ты забыл имя человека, ты можешь сказать: «Найди мне презентацию, которую мне выслал человек, забыл, как его зовут, он приехал из Бостона, или мы встречались с ним в Петербурге». Система интерпретирует такой запрос, и она знает, кто, что, когда, она знает онтологическую структуру твоих данных и позволяет находить один объект по описанию, связанный с другим объектом».
- «Мы сейчас не хотим мучить пользователя кучей настроек. Мы хотим, чтобы система сама догадывалась, что важнее человеку, а что менее важно. Сейчас Findo ранжирует людей на основе вашей телефонной книги. Система определяет, кто в вашей жизни важнее, делает это на основе того, сколько раз вы отвечали человеку, как быстро, что было в теле письма, то есть она пытается понять, кто в вашей жизни, условно говоря, начальники, важные клиенты и партнеры, родственники, друзья. Сообщения от них она ранжирует выше, чем от тех, с кем вы никогда не общались или кому совсем не отвечали на письма».
Про инвестиции - «В Кремниевой долине, как и в любой другой точке мира, инвестируют бизнес-ангелы, венчурные фонды и компании. Это классическая схема инвестирования. Вначале это friends and family - idea stage. Затем prototype stage, у вас раунд business angels - они дают $100 000-300 000, это характерный размер раунда бизнес-ангела. Потом seed round - это может быть около миллиона долларов. Затем А-раунд - это $3-5 млн. Где-нибудь в конце после раунда B или D может (если повезет) случится IPO, либо продажа бизнеса стратегическому инвестору. Стратеги - это, как правило, крупные компании. Facebook, Google, Microsoft, Apple и сотни других компаний выступают стратегами для технологических стартапов».
- «Абсолютно все крупные компании скупают таланты в виде компаний. Основной метод привлечения сильных команд, сильных людей вместе с технологиями - это конечно покупка компании - так называемый Acqui-hiring (от слов Acquisition и Hiring). Представьте, если у большой компании, скажем Microsoft, есть задача быстро начать новое продуктовое направление, то есть два пути: нанять отдельных специалистов или привлечь готовую команду. Наем отдельных специалистов это экстенсивный, очень долгий путь, есть очень высокий риск того, что человек не впишется, уйдет, еще что-то. А покупка команды - это готовая единица со своей внутренней химией, которая уже показала свою успешность. Acqui-hiring обычно происходит в Кремниевой долине по цене $250 000-1 000 000 за специалиста. То есть команда из 5-7 сработавшихся и реально сильных ребят может быть куплена за $1-5 млн».
Российские экономические реалии никто не отменял. Они помогают с точки зрения стоимости рабочей силы, высокий курс доллара к рублю помогает командам разработчиков, которые имеют международные амбиции по продажам. С другой стороны, такая ситуация мешает заниматься локальным бизнесом и развивать локальный рынок.
- «Я не могу сказать, что в России нет подходящего инвестиционного климата для ИТ. Просто российский рынок не такой большой и в этом смысле размер проектов относительно ограничен. И, мне кажется, многие инвесторы, расширившие свой портфель, инвестируют не только в российские, но и в западные команды. Параллельно происходит и следующее: если раньше российские компании были в основном ориентированы только на локальный рынок, то в последние годы они начали активнейшим образом ориентироваться на международные рынки».
- «Я вижу большой интерес российских инвесторов к области автоматизации потребительских сторон нашей жизни: всевозможные marketplaces, интеграции офлайна и онлайна, Uber для всего. Возможностей огромное количество. Эти компании, как правило, работают не только в России, но и в Европе - в Европе, в отличие от США рынок очень дефрагментирован, и для различных агрегаторов поле огромное».
Про будущее - «Мне кажется, что в какой-то момент количество перейдет в качество. Качество интеллекта у всех этих систем будет расти. Считается, что к 2030-2040 годам настольный компьютер сравняется по производительности с производительностью человеческого мозга. Получается, что в какой-то момент будет достигнута точка сингулярности, когда компьютер становится таким же умным, как человек, или умнее, а, значит, начинает создавать и обучать систему такого же класса. И начинается совершенно другая кривая роста. С теоретической точки зрения так должно произойти. Растет производительность? Растет. Если растет, достигнет когда-нибудь человека? Ну вроде, как достигнет (если атомная война не произойдет). А если достигнет, означает ли это, что компьютер начнет создавать новые системы лучше, чем может создавать человек? Вроде как означает».
- «К сожалению, популяризация - неизбежный виток развития. Фастфуд много лет доминировал и продолжает доминировать, но теперь, когда люди поняли, что есть диабет, есть ожирение и другие смертельные заболевания, связанные с питанием, вдруг появилась органическая еда, появились органические рестораны. Появилось желание, к сожалению, не очень мощное со стороны потребителей, но, тем не менее, тот сегмент, которому это надо, очень лоялен, он готов платить больше, чтобы есть полезную еду. Мы пытались делать рестораны полезной еды, все провалилось. Не получается. В Америке чуть-чуть уже получается, и то только в таких регионах, как Кремниевая долина. Обществу нужно на 70% оказаться в проблеме ожирения, чтобы задуматься над этим. То же самое - ожирение мозгов. Junk food для мозгов, наверно, в какой-то момент приведет к каким-то проблемам в обществе, и тогда общество задумается».
Беседовали Петр Рушайло и Анастасия Горшкова
Источник: www.forbes.ru
Комментарии:
|