Бесплатные числа

2016-03-31 20:15

Бесплатные числа

Учебники математики могут стать ценнейшим источником бизнес-идей. Формулы не защищены патентами, за их использование не надо платить роялти и они не имеют срока давности. Надо лишь суметь увидеть в открытиях великих математиков решения простых житейских проблем.

Живший в XIII веке алхимик Раймонд Луллий призывал внимательно изучать математические трактаты. В те времена эта область знаний считалась чем-то вроде гуманитарной науки.

Здесь искали ключ к универсальному знанию - рецептам идеального государственного устройства, продления жизни и, конечно, приготовления золота. Золото приготовить Луллию не удалось. Однако именно он стал создателем первой «машины по производству знания», вдохновившей английского писателя Джонатана Свифта на изобретение слова «компьютер».

Современные компьютерщики не меньше, чем их средневековые собратья, ценят старинные формулы. Нашему современнику, французскому математику Мишелю Бера, изучение наследия русской математической школы помогло сформулировать решение, во много раз увеличившее бизнес компании KXEN, в которой Бера начал работать в 2000 году. В отличие от Луллия, Мишелем Бера двигал не теоретический, а практический интерес: для него погоня за математическими сокровищами прошлого оказалась вынужденной - бизнес его компании зашел в тупик, почти не успев начаться.

Автоматизация добычи

Владимир Вапник, работавший в 1970-е годы в Институте проблем управления, вряд ли думал о коммерческом применении результатов своих трудов. Вапник вместе с коллегами разрабатывал теорию статистических моделей, которая впоследствии получила название «теория Вапника-Червоненкиса». Главной идеей этой теории стала формула оценки риска (то есть вероятности ошибки) любой статистической модели. Основное достоинство формулы заключалось в том, что она позволяла контролировать ситуацию даже при необходимости учитывать тысячи параметров (а именно этого требует, скажем, моделирование поведения потребителей).

Вряд ли кто-то мог оценить преимущества теории Владимира Вапника лучше, чем Мишель Бера и его компания KXEN. Сфера деятельности KXEN - решения в сфере датамайнинга (англ. data mining - вскрытие данных). По сути, датамайнинг - это автоматизированный поиск закономерностей в больших массивах данных. «Контроль риска особенно важен, когда необходимо, например, всего за несколько секунд провести авторизацию кредита или зарегистрировать выдачу страхового полиса, и при этом могут быть задействованы тысячи переменных»,- говорит Мишель Бера. Спрос на подобный анализ весьма велик: уже сегодня мировой рынок датамайнинга превышает $1,5 млрд.

Но в 2000 году Мишель Бера и его партнеры наткнулись на барьер роста своего бизнеса. Датамайнтинг в традиционном виде - очень трудоемкая процедура. Неважно, насколько совершенные алгоритмы применяются для анализа, без определенной «ручной работы» здесь было не обойтись.

Американская статистическая школа, в традициях которой тогда работала компания KXEN, предполагает детальный анализ данных еще до перехода к решению задачи. «Если нам нужно отделить овец от козлищ, статистик американской школы будет строить чрезвычайно детальную модель -овцы- и -козлища- и затем уже перейдет к их разделению»,- говорит Михаил Аветисов, заместитель директора российской ИТ-компании «Ксема», партнера KXEN. В результате исследование получалось слишком дорогим. В то время как даже большая датамайнинговая компания могла брать не больше 10 заказов в год, работая только для крупных клиентов.

Мишель Бера стремился к совершенно иной форме бизнеса. Он хотел сделать датамайнинг массовой услугой. Но для этого надо были искать совсем другие подходы. Как раз тогда ему в руки попала книга советского математика Владимира Вапника «Восстановление зависимостей по эмпирическим данным», переведенная на английский язык еще в 1982 году. Для Бера книга оказалась настоящим открытием. Русская школа статистики, одним из представителей которой и был Вапник, не требовала детального анализа данных до решения задачи. «Приспособив под свои нужды алгоритмы Вапника, компании KXEN удалось практически исключить из процесса ручную обработку данных»,- говорит Михаил Аветисов. Из товара для избранных датамайнинг превратился в продукт, который можно было вывести на массовый рынок. Познакомившись с технологией KXEN, один из сотрудников IBM Ричард Тейлор написал в своем блоге: «Раньше я считал, что data mining - последнее, что может быть сделано с данными, настолько это сложно. Теперь я вижу, что это - самое первое, что можно с ними сделать».

Многогранная проблема

Вероятно, средневековые ученые были не так уж неправы, пытаясь найти в математике прошлого универсальные формулы. Во всяком случае, для современного бизнеса математические решения ХХ века могут оказаться настоящей золотой жилой. «Никогда не было лучшего времени для математиков, чем сейчас»,- говорит главный криптограф США, руководитель исследовательского подразделения криптографического Агентства национальной безопасности Джеймс Шатц, имея в виду интерес бизнеса к математическим исследованиям. По статистике, примерно каждый пятый PhD по математике из крупных университетов IVY League работает в сфере бизнеса.

Впрочем, история одного из самых распространенных в современном бизнесе математических решений началась не Гарварде и не в Принстоне. В конце 1930-х годов советский математик и экономист Леонид Канторович работал над задачей с малопонятным для обычного человека названием «поиск максимальных и минимальных значений линейной функции от нескольких переменных при наличии ограничителей». Для решения задачи Канторович предложил представить функцию в виде многогранника, так, чтобы минимальные и максимальные значения располагались на его вершинах. Вычислительную мощь этого алгоритма обычно демонстрируют при помощи следующей задачи: как наилучшим образом распределить 70 различных заданий среди 70 человек? Простым перебором эту задачу не решить - слишком много вариантов. Методом Канторовича решение легко находится на вершинах функции-многогранника. В США этот алгоритм успешно применялся для управления поставками военной техники и был засекречен до конца войны. В Советском союзе эти же методы «работали» при управлении плановым хозяйством. В 1975 году создатель алгоритма Канторович получил Нобелевскую премию по экономике за свои работы по экономическому планированию. А в 1980-х эти идеи перевела в область микроэкономики компания Procter & Gamble. С помощью метода Канторовича здесь наладили управление поставками через интернет. Поставщики могут конкурировать между собой, предлагая разные типы продуктов и разные уровни обслуживания. Для выбора оптимального варианта используются все те же линейные алгоритмы, созданные больше полувека назад.

«Копайтесь в математических архивах!»- призывает предпринимателей эксперт по новым технологиям американец Майкл Шрэйдж. «Старые математические алгоритмы могут стать таким же привлекательным объектом для бизнеса, как и старые патенты, за которыми несколько лет назад началась настоящая охота»,- утверждает он. Разница лишь в том, что алгоритмы, в отличие от патентов, никому не принадлежат и находятся «в открытом доступе». Этот ресурс абсолютно бесплатен и «неприватизируем». Что, разумеется, не мешает запатентовать созданные на основе старых алгоритмов новые бизнес-идеи.

Игры разума

В фильме «Игры разума» математик Джон Нэш в исполнении Рассела Кроу придумывает формулу своего знаменитого равновесия Нэша в баре, размышляя об оптимальном поведении группы мужчин, стремящихся закадрить девушек. Рациональное поведение каждого отдельного игрока оказывается нерациональным с точки зрения общего результата: если все начинают ухаживать за самой красивой девушкой, остальные девушки обижаются и все остаются ни с чем. «Рациональные поступки не всегда разумны»,- говорит Нэш. Формула, родившаяся, по утверждению авторов фильма, для моделирования сексуальных отношений, подошла для экономики и даже участвовала в создании современной системы международной торговли. Именно за объяснение рационально-неразумного поведения экономических субъектов Нэшу в 1994 году дали Нобелевскую премию.

Немецкий математик Фердинанд Фробениус (1849-1917), как и Нэш, поражал современников удивительной способностью мгновенно производить сложнейшие расчеты. Сегодня Фробениуса все чаще вспоминают в неожиданном контексте, как человека, сделавшего возможным поисковый алгоритм Google.

В 1990-е годы один из основателей компании Google Лари Пейдж обратил внимание на доказанную Фробениусом теорему матричного анализа (известна как теорема Перрона-Фробениуса). Ее выводы позволяли, например, рассматривать интернет с его системой перекрестных ссылок как огромную матрицу, одновременно измеряя значимость каждой ссылки. Благодаря этому стал возможен механизм ранжирования страниц с учетом перекрестных ссылок, обеспечивший феноменальный успех Google.

Фробениус считается одним из пионеров исследования матриц. Однако сам термин «матрица» создал не он, а английский математик середины XIX века Джеймс Джозеф Сильвестер. С его легкой руки это слово появилось на свет в 1848 году, самой же матрицей стали называть прямоугольные таблицы чисел.

Математики оценили важность матричного анализа задолго до появления самого термина. А вот в бизнесе матрица чисел неожиданно превратилась в матрицу людей, благо законы математики позволяли подставлять в ее ячейки все что угодно - от чисел и переменных до сложных функций. Произошло же это так. В 1957 году американский математик и инженер Кен Ольсен основал компьютерную компанию DEC. Задача, поставленная Ольсеном перед бизнесом, выглядела почти невозможной: производить компьютеры лучше и современней, чем IBM. DEC одной из первых перевела свои компьютеры на дорогую тогда микросхему и уже в начале 1960-х добилась некоторого успеха. Однако Ольсена не удовлетворяла традиционная организация управления: чтобы не сбавлять темп, DEC постоянно приходилось работать над несколькими проектами, а все управление ресурсами при этом оставалось централизованным. Тогда Ольсен решил построить управление по матричной модели: каждый проект получил самостоятельность, но при этом некоторые ресурсы стали централизованными. Сотрудники оказались словно в клеточках матрицы, и теперь у каждого из них могло быть по два босса (а то и больше). Сочетание передовой системы управления и передовых технологий позволили DEC серьезно потеснить IBM на компьютерном рынке. Возможно, компания процветала бы и сейчас, если бы Ольсен полностью не игнорировал рынок персональных компьютеров. В 1977-м он произнес знаменитую фразу, которая стала для DEC смертным приговором: «Не существует причин, по которым обычному человеку был бы нужен компьютер дома».

Язык формул

«Место прописки» большинства героев эры информационных технологий - Силиконовая долина - кажется раем для математиков. Тем не менее, там у исследовательских компаний тоже есть специфические трудности. «В Америке мы никогда бы не смогли заниматься фундаментальными исследованиями. В нашей компании люди работают по 8-12 лет, новый сотрудник в исследовательском проекте начинает приносить серьезную отдачу только после двух лет работы. А в Силиконовой долине инженер, который три года не менял место работы, считается неудачником»,- рассказывает Давид Ян, президент российской компании ABBYY.

ABBYY известна прежде всего как производитель программ распознавания текстов и электронных словарей. Но в ближайшее время она намерена вывести на рынок новый, гораздо более универсальный продукт - Natural Language Compiler (NLC). NLC - программное ядро анализа и обработки речи. Систему можно будет применять для распознавания языков, текстов, машинного перевода и смыслового поиска вне зависимости от ключевых слов. Цель проекта - научить машину «понимать» обычный человеческий язык. «Мы уже инвестировали в NLC примерно 500 человеко-лет и готовы инвестировать еще столько же к моменту его запуска в 2009 году»,- говорит Давид Ян. Инвестиции должны обернуться масштабным расширением бизнеса ABBYY: по оценке Яна, весь объем рынка распознавания текстов в мире не превышает $500 млн, в то время как потенциальный рынок технологий NLC как минимум на порядок больше.

Главная техническая трудность проекта заключается в том, что примерно 70% языковой информации теряется в момент передачи и восстанавливается адресатом исходя из контекста. Мы можем не расслышать часть слова или предложения, но понять смысл фразы. Научить этому машину кажется почти невозможной задачей. Отсюда одна из особенностей математической методологии ABBYY, созданной в 1990-е годы ученым Александром Шамисом. Ее программы не просто воспринимают данные, а строят гипотезы в зависимости от контекста, действуя как живые системы.

В основе моделей, предложенных Шамисом, лежит принцип устойчивого неравновесия. Эту концепцию сформулировал советский биолог австрийского происхождения Эрвин Бауэр в 1930-е годы. Согласно ей, живые системы совершают работу только за счет энергии неравновесия с внешней средой, а не благодаря энергии, поступающей извне, которая расходуется на поддержание неравновесного состояния системы. В состоянии «устойчивого неравновесия» и активного взаимодействия с миром алгоритмы ABBYY смогут «угадывать» пока недоступные машинам смыслы, надеются Давид Ян и его коллеги.

Старые формулы то и дело начинают новую жизнь в современном бизнесе. Невозможно предсказать, какая из них даст жизнь новому Google или произведет революцию на товарных рынках. Поэтому, возможно, стоит, по примеру самых первых «компьютерщиков» из далекого средневековья, просто еще раз заглянуть в математическую библиотеку.

Алексей Гостев

Источник: www.kommersant.ru

Бесплатные числа

Комментарии: