«Наш стартап создан для того, чтобы преодолеть зиму ИИ», — Василий Мазин, Mind Simulation |
||
МЕНЮ Искусственный интеллект Поиск Регистрация на сайте Помощь проекту ТЕМЫ Новости ИИ Искусственный интеллект Разработка ИИГолосовой помощник Городские сумасшедшие ИИ в медицине ИИ проекты Искусственные нейросети Слежка за людьми Угроза ИИ ИИ теория Внедрение ИИКомпьютерные науки Машинное обуч. (Ошибки) Машинное обучение Машинный перевод Реализация ИИ Реализация нейросетей Создание беспилотных авто Трезво про ИИ Философия ИИ Big data Работа разума и сознаниеМодель мозгаРобототехника, БПЛАТрансгуманизмОбработка текстаТеория эволюцииДополненная реальностьЖелезоКиберугрозыНаучный мирИТ индустрияРазработка ПОТеория информацииМатематикаЦифровая экономика
Генетические алгоритмы Капсульные нейросети Основы нейронных сетей Распознавание лиц Распознавание образов Распознавание речи Техническое зрение Чат-боты Авторизация |
2019-01-10 10:00 Лаборатория Mind Simulation на AI Conference показала демо своего чат-бота Steve с ИИ: программа отвечала на вопросы пользователей, используя ядро своей технологии — Core Expert. В будущем Core станет универсальным ИИ, способным решать многие задачи в образовании, банкинге, медицине и повседневной жизни вместо людей. Василий Мазин, директор по научным исследованиям Mind Simulation, рассказал «Хайтеку», как решение кубанских математиков поможет преодолеть «зиму» ИИ, чем их Steve лучше «Алисы» и Alexa и как голосовые помощники будут общаться между собой без участия человека. Персональный ассистент с ИИ — Расскажите о проектах вашего стартапа — Core Expert и Steve. — У нас не совсем стартап в традиционном понимании, а скорее научная лаборатория. Сейчас мы сосредоточены на разработке интеллектуального ядра, которое называется Core Expert, подобрали под разработку специальную команду. Она ориентирована на два проекта. Core — сама модель и технология, ядро. И Steve — пример, как технология может использоваться в одной задаче — персональный ассистент с ИИ, который сможет вести полноценный диалог на любые темы. — Чем вы занимались до этого? — Один из моих предыдущих проектов — это Urban, моделирование распространения опасных факторов пожара. Там использовалась физика и математика. Это был коммерческий b2b-проект. Например, экспоцентр, где мы сейчас находимся, должен иметь документы о том, что происходит при пожаре. Модель делается в программе, и одна из таких программ — наша. Там чертятся 2D- и 3D-модели здания, расставляются люди, просчитываются разные сценарии пожара. — Как технологически связаны нынешний проект и тот? — Никак не связаны. ИИ меня интересовал еще тогда, когда я в университете занимался наукой. Я работал 16 лет в Кубанском государственном университете на факультете прикладной математики. Несмотря на то, что защитился по другой специальности, со студентами в курсовых и дипломных работах часто использовал ИИ. Хотел создать лабораторию в университете, и первоначальные договоренности были. Но из-за жесткой бюрократии тяжело было спокойно это воплотить в реальность. В итоге вместе с коллегами и партнерами основал лабораторию ИИ. И уже можно посмотреть, что мы за прошлый год перенесли из методологии на бумаге в конкретное решение. Когда-то у ИИ будет столько же нейронов, сколько в человеческом мозге — Давайте поговорим о Core Expert. У вас на сайте написано, что цель — создать универсальный ИИ. В чем заключается его универсальность? — Есть так называемые ИИ-полные задачи. Возьмем одну из них — диалог на естественном языке. Для того, чтобы компьютер с вами разговаривал и работал естественно, как человек, нужно очень потрудиться. Эта задача очень сложная и практически невыполнимая. Ее может решить так называемый сильный ИИ. Это интеллект, который по возможностям не уступает человеческому. Есть меньшая ступенька — универсальный ИИ, то есть такой, который не нужно переписывать каждый раз под конкретную задачу. Сейчас как делается: берется задача, под нее подстраивается модель из существующих. «Ага, тут мы нейронную сеть будем использовать, а тут мультиагентные системы». Наша идея — создать единое ядро, которому все равно, какая проблема будет стоять перед ним. Внутри — структура представления знания, обработки его не меняются. Это универсальное решение. А когда дорастет до человеческого уровня — будет сильный ИИ. — ИИ совсем не новая технология, неужели не возникало похожих проектов? — Сейчас никто ничем подобным не занимается. А первый проект по разработке универсального ИИ возник еще в 1950-х годах. Те, кого мы знаем как основоположников ИИ, размышляли так: «Давайте летом на каникулах встретимся, — они были в академической среде. — И за недельку-две создадим универсальный ИИ». Понятно, что ничего не получилось, и с тех пор эта задача возникает постоянно. Тема универсального искусственного интеллекта очень гремела в 70–90-х годах, а потом наступила тишина. Это связано с тем, что как только начинали ее решать, утыкались в технологический, алгоритмический или еще какой-то тупик. Все это стало немного скандальным направлением, поэтому сейчас очень осторожно про него рассказывают. Сегодня мы видим большой всплеск интереса к ИИ: появилось оборудование, позволяющее обрабатывать глубокие нейронные сети, глубокое обучение. Все понимают, что классические нейронные сети, которые сейчас используются, не позволят достичь универсальности из-за жестких ограничений самой технологии. Может быть, когда-то там будет столько же нейронов, сколько в человеческом мозге, в них будут разные структуры, они будут скомбинированы друг с другом. Тогда и решится проблема. Мы в эту сторону даже не смотрим: может быть, в ближайшие 100 лет и оборудования не будет, которое это потянет. Поэтому занимаемся немного другим. Разработчикам выгодно, чтобы чат-бот давал максимальное число правильных ответов — Сколько человек у вас работают над созданием ИИ? — Сейчас десять человек трудятся в Краснодаре. В марте, может быть, добавятся еще два. В основном это выпускники прикладной математики, где я преподавал. Часть из них — мои бывшие дипломники, студенты и аспиранты. — В каких сферах может использоваться универсальный ИИ? — Сейчас Steve — это демонстрация возможностей ИИ, а не цельный продукт. Его надо показывать кому-то, кто понимает внутреннее устройство ИИ, чтобы максимально эффективно раскрыть. Это просто такое демо. Со временем он будет трансформироваться в полноценный продукт с голосовым интерфейсом. Без голоса такой продукт уже невозможен. А обучение может быть по-разному выстроено. Например, вы хотите узнать, какие направления музыки есть, а Steve может рассказать о них и протестировать вас — дать музыкальные отрывки, чтобы понять, разбираетесь вы в музыке или нет. Он выстроит персональный образовательный курс. Одна из моих разработок «на коленке» — программа в помощь студентам художественного факультета. У них на первом-втором курсе есть предмет, где нужно знать картины, кто их автор, когда они написаны. И нужно знать тысячи таких картин. Приложение создавало систему, по которой студенты могли обучаться, тестировать себя. Это все может переместиться в Steve. Даже учить не надо. Сейчас мы ведем переговоры с партнерами из сфер банкинга и медицины. В клиниках, например, это может быть консультант. Он поможет выявить проблему и определить врача, к которому следует обратиться. Сейчас волна чат-ботов на пике, и понятно, что нужно внедрить продукт, предлагающий большие возможностям. Консультирование — самое простое, со временем ИИ сможет брать на себя все большие обязанности. — Это отсекает работу колл-центра? — Да, это его замена. Сбербанк туда идет. В нескольких банках такое внедрили, они рапортуют, как много денег сэкономили, что появилась поддержка 24/7, как улучшилась поддержка клиентов. Понятно, что процент правильных ответов в районе половины. —Что значит правильных? — Тех, которые соответствуют тому, что подразумевал пользователь. В чат-боты в основном какая-то обработка нейронными сетями идет, а вероятность ошибки очень большая. По-другому человек сформулирует запрос — и все, ответ может прийти из другого кластера ответов. Соответственно, система ответит не на тот вопрос, который задал человек. Сейчас схема монетизации такая: оплата создателям бота идет за каждый правильный ответ. Неправильный не считается, а за правильный, например, 5 рублей. «Модульбанк» так работает. Получается, разработчикам выгодно сделать так, чтобы было максимальное число правильных ответов. «Готовых ответов нет» — Почему сейчас невозможно создать продукт без голоса? — Есть «Алиса», есть Alexa, они все с голосом. Возможность общаться текстом важна, но это прошлый век. Если мы хотим создать интеллектуальный продукт, то голос ему необходим. — А чем Steve концептуально отличается от «Алисы» и Alexa? — Steve думает. «Алиса», Alexa и остальные — нет. — «Алиса» обучается от взаимодействий с пользователями. — Да, только не совсем понятно, чему. Да и сам термин «обучение» в отношении «Алисы» и других ассистентов сильно искажен, как и понятие ИИ в целом. Никто не знает, чему она обучается. Возьмем «Алису»: она из всех представленных наиболее интересная. Там три направления: она либо отправляет в поиск, либо у нее есть шаблон, который помощник может дать как ответ по алгоритму; если ни туда, ни туда она не отправляет, запускается нейросеть, по которой выдается ответ. Нейросеть берется из опыта диалога с пользователями, и никто не знает, на какой вопрос и что она может ответить. «Алиса» просто выбирает фразу с наибольшим «весом». Интеллекта и мышления здесь нет. В нашей системе ответов не заложено. Каждый ответ генерируется с помощью внутреннего мышления. Мы можем отследить цепочку суждений нашего ИИ, а другие нет, так как нейронные сети — это «черный ящик». В будущем Steve сам сможет объяснять, почему он думает так, а не иначе. — Вы под внутренним мышлением имеете в виду универсальный ИИ, который позволяет обучаться не на основании диалогов? — У нас достаточно будет один раз прочитать книгу, документ или просто услышать информацию. А в нейронных сетях требуется много циклов обучения. Рассмотрим кейс банка, например. Нужно сделать интеллектуального помощника. Достаточно будет списка инструкций, который они дают сотрудникам колл-центра. Этого будет достаточно, чтобы обучиться и начать работать. — Steve будет обращаться к базе текстов, если ему чего-то не хватает? — Если вы захотите его чему-то обучить, ему нужно, как и человеку, предоставить материалы. Человек пришел, он хочет быть консультантом — вот список документов, которые нужно изучить. Тут есть другая особенность — Steve будет отвечать по-своему. Готовых ответов нет, и они будут генерироваться автоматически, грубо говоря, он будет все эти знания своими словами рассказывать. Внутри Steve не думает на естественном языке, у него собственное представление и образное мышление. Поэтому есть вариант цитирования. Если, например, вам нужно процитировать какой-то параграф инструкций или другого правила, он не будет синтезировать его из знаний, а возьмет этот кусок и приведет целиком. — Что это за тексты, кто их составляет? — Есть несколько этапов обучения. Первый этап — когда ядро пустое, у него никаких знаний нет. Тогда нужно создать некоторую карту знаний — начальные представления об устройстве мира. Эта часть выполняется экспертом. Мы пытались пару раз сделать это автоматически, но получалось некрасиво и не то, что надо. Автоматически — значит дать большой корпус текстов и попытаться вытащить какие-то знания оттуда, используя статистические методы. Это не получалось. Как выяснилось, если мы хотим составить картину мира, никакие тексты не помогут, потому что существует огромное количество умолчаний. То, что с самого детства откладывается, то, с чего мы начинаем постигать мир, никто в текстах не прописывает. Поэтому и появляются огромные проблемы в знаниях. Соответственно, если никто это не пишет, статистический метод не найдет там ценные знания. В итоге вернулись к тому, что начальную карту знаний составляют эксперты. Следующий этап — углубить эту карту знаний. Вот здесь уже можно работать с большим корпусом текстов. У нас такой собран — там 7 млрд слов. Мы третий раз уже составляем этот корпус, а первые два были неправильно сбалансированы. В них нужен баланс — научные тексты, исторические, художественные, статьи, новости. Один раз мы переборщили с новостями, и там появились «выбросы» (статистический термин — «Хайтек») по знаниям. Дальнейший этап начнется, когда будет достигнута некоторая критическая масса знаний, — он начнет просто читать тексты. Хотим мы, например, банковскому делу обучить — вот книжечка по банкам, внутренние инструкции, и он их однократно читает. Мы делали такие эксперименты с «Курочкой Рябой» и «Репкой», и даже на нынешнем уровне развития ИИ все хорошо получалось. Далее мы будем делать то же самое, но на намного более сложном уровне. — Что это за эксперты, которые подготавливают базу текстов? — У нас два человека, которым ставится задача проверки корректности входящих знаний. Мы часто используем мозговой штурм, а иногда приходится обращаться к экспертам. — К лингвистам? — Не только, хотя и к ним обращались, когда формировали языковые модули. Чаще к психологам и философам. У нас была очень узкая проблема, и философы подсказали, как ее можно решить. Тут важен не текст, а понимание того, как это все связать воедино. Год назад этого понимания изначально не было. Решение теперь найдено. — Почему нужно приглашать экспертов из гуманитарного поля, а не решать технически? — Проверить легко. Как самым простым способом посмотреть, что это универсальный интеллект? Давайте сделаем естественный диалог. Будете общаться с ним — сразу увидите: что-то не так. Когда мы собрали первую итерацию и посмотрели, что он умеет и как может отвечать, увидели огромные пробелы и непонимание. Как преодолеть зиму ИИ — Как вы оцениваете возможности для продажи технологии универсального ИИ? — Сейчас очень модно выделять деньги на что-то, связанное с нейронными сетями, потому что это на слуху. Правда, появились уже звоночки, что сети не решат все проблемы. Недавно была статья главы ИТ Сбербанка, которая так и называлась — «Зима искусственного интеллекта». Это уже пятый или шестой виток: предсказывают «зиму», и она приходит. Когда я этим занимался в 2006 году, мне говорили: «Чем ты занимаешься, нейронные сети — это отстой». Тогда была «зима», и нейронные сети были в упадке. В 2009 или 2010 году произошел прорыв. Благодаря продвинутому оборудованию появилась возможность работать с глубинными нейронными сетями. Много нейронов, много слоев, можно по-разному обучать. Но теоретические ограничения, которые изначально еще описывались в 1970-х, не преодолеваются этим оборудованием. Поэтому сейчас все, что можно сделать, решат этими нейронными сетями, а дальше где развитие? В эту тему никто академически в не вкладывается. Кто помнит эти взлеты, те с недоверием относятся к новой технологии. — Как вы представляете развитие своего стартапа, если действительно настанет такая «зима» и интерес угаснет? — Наш стартап создан для того, чтобы эту «зиму» преодолеть. Возможно, все перейдут на тот подход, который мы предлагаем. Звоночки уже появляются: зачем упираться в одну технологию, если можно начинать комбинировать? Тогда и пойдут гибридные модели. — Почему в академической среде никто не продолжает исследование? — В академической среде должны выделяться гранты. А они выделяются под что-то понятное и известное. Что мы сейчас предлагаем — эта технология может быть непонятной и неизвестной. Поэтому к ней относиться будут с опаской. Потихоньку будем ее освещать. — Когда вы сможете показать диалог на естественном языке? — Разработка идет циклично. Каждый цикл состоит из этапов, и в конце происходит демонстрация чего-то. Первый цикл закончится в феврале 2019 года, и тогда это будет диалог на естественном языке на достаточно высоком уровне. Все это будет нетребовательно к оборудованию и сможет работать без интернета. — Есть ли у вас предложения не для бизнеса, а для потребителей? — Для потребителей — просто интеллектуальный помощник Steve, который вы можете установить себе на телефон, например, и общаться. Наша основная цель — создать полноценного собеседника, а не только помощника. Вы сможете поговорить на любую тему с ним, даже личность ассистента можно будет подстроить под себя. Даже просто как психологическую разгрузку. — Какие у вас есть конкуренты в b2c-сегменте? — Прямых конкурентов нет. Есть очень отдаленно напоминающая наше решение Viv, из нее потом Samsung сделал Bixby. Внутри она устроена по-другому, но визуально на конференциях представляли что-то похожее: одно приложение — все задачи. — Каким вы видите свой голосовой помощник через несколько лет? Что он сможет делать? — Он будет стоять у каждого, вы с ним сможете общаться, он будет решать большинство ваших рутинных проблем. Освобождает вашу жизнь для вас самих. — В чем преимущество вашего решения над Alexa или Siri? — С ними нельзя просто пообщаться нормально, нельзя научиться чему-то. Проще говоря, голосовые помощники сейчас — это просто голосовой поиск, который завернут в интерфейс колонки или бота. В поиске вы сначала увидите рекламу, потом SEO-ссылки, и только потом решение. Им постоянно требуется интернет для работы. Напрямую ответ они могут дать: грубо говоря, на часто задаваемые вопросы оформляют карточки с ответом. Но это практически ручная работа, этим не охватишь все. Вы обращаетесь с проблемой, и голосовой помощник напоминает: «Пройди обследование такое-то, ты у зубного полгода не был, могу тебя записать прямо сейчас». Если это станет массово, то он позволит общаться с другими людьми, когда они напрямую не смогут. Помощник связывается с другим помощником, у того есть расписание, он может уточнить, сможете ли вы тогда-то встретиться. Помощники будут брать бэкграунд, неинтересные вещи, нудные. Просто даже разговаривать с вами: устали вы, некому все высказать — вот, расскажите помощнику. Источник: hightech.fm Комментарии: |
|