Большие данные — большие надежды

МЕНЮ


Новости ИИ
Поиск

ТЕМЫ


Внедрение ИИНовости ИИРобототехника, БПЛАТрансгуманизмЛингвистика, рбработка текстаБиология, теория эволюцииВиртулаьная и дополненная реальностьЖелезоКиберугрозыНаучный мирИТ индустрияРазработка ПОТеория информации

АРХИВ


Июнь 2017
Май 2017
Апрель 2017
Март 2017
Февраль 2017
Январь 2017
Декабрь 2016
Ноябрь 2016
Октябрь 2016
Сентябрь 2016
Август 2016
Июль 2016
Июнь 2016
Май 2016
Апрель 2016
Март 2016
Февраль 2016
Январь 2016
0000

RSS


RSS новости
птичий грипп

Новостная лента форума ailab.ru

2017-06-14 13:15

большие данные

В вопросе о больших данных можно быть только партнерами, считает Джордж Хелд

Теле- и поисковые операторы, retail-платформы накапливают огромное количество данных. Так, дата-центры Apple и Amazon уже сравнимы по площади с небольшими городами. Джордж Хелд, вице-президент по развитию цифрового и нового бизнеса ПАО «ВымпелКом» (бренд «Билайн»), рассказал, как сейчас используются пользовательские данные, которыми владеют телеоператоры, как он видит будущее библиотек в мире больших данных и почему этический вопрос — основной в проблеме big data.

Мир больших данных уже наступил. Сегодня, когда телефоны перестали быть просто телефонами, а стали маленькими компьютерами, телеоператоры накапливают огромное количество данных о пользователях: о характере использования телефона и Интернета, передвижениях, активности в социальных сетях и многое другое. Как же они используют их? «Все традиционные, old school анализы аудитории абсолютно неправильные, — утверждает Джордж Хелд. — Потому что они используют мнение людей, которое постоянно меняется. Мы же знаем, как люди на самом деле себя ведут».

Проекты на основе big data

Предсказать, где построить следующий универмаг, чтобы он обслуживал клиентов лучше, чем любая другая сеть, и как расставить по городу рекламные щиты с учетом передвижений целевой аудитории, чтобы не тратить деньги впустую — это самые простые вопросы, на которые могут ответить сегодня крупные телеоператоры с помощью big data. «Мы видим, — говорит Д. Хелд, — как двигаются потоки людей и где, в какой момент времени они находятся, чтобы их правильно таргетировать».

Одна из важнейших задач в планировании современных городов — определить, где население должно жить, работать и как передвигаться. Пятнадцать лет назад люди стремились жить в пригородах и ездить на работу в город, а чтобы они могли передвигаться, строились большие дороги и мосты, на которых вскоре возникали дорожные пробки. Проект, разработанный компанией «Билайн» на основе больших данных для мэрии Москвы, определяет, как люди живут и работают в разных районах города и классифицирует районы по типам активности. «Есть многофункциональные районы, где люди и живут, и работают — им не нужно ехать, — рассказал Джордж Хелд. — Есть районы, в которых люди только работают, но не живут, и, с точки зрения ситидевелопера, эти районы являются правильным стратегическим местом, чтобы строить в них жилые дома. Есть районы, в которых только живут, но не работают — и здесь правильно строить бизнес-центры, чтобы люди могли там работать. Так решается самая большая проблема с трафиком и движением людей. Не всегда нужно строить третье, четвертое, пятое Садовое кольцо, можно просто правильно расставить здания. А для этого нужно посмотреть в big data, как люди живут и где размещаются».

Еще один важный тип данных — информация о трафике и передвижениях людей в разное время «Мы смотрим, — поделился Д. Хелд, — когда люди едут на работу и когда возвращаются, накладываем эти данные на географическое место. Таким образом рассчитываем загруженность дорог и определяем, где правильно создавать паркинги. Возможности применения big data фактически безграничны».

Programmatic против масс-маркета

Programmatic, алгоритмическая модель закупки интернет-рекламы на основе данных о целевых пользователях, — гордость «Билайн», поскольку он использовал ее первым в мире. Programmatic полностью создан вокруг big data. Как же работает эта модель? «Вы находитесь онлайн, смотрите какой-то сайт, — поясняет Джордж Хелд, — и вдруг перед вами появляется реклама от Nike. Под этой рекламой — технология big data. Мы размещаем на виртуальном аукционе анонимизированную информацию профайла: возраст и покупательную способность, вычисленную по специальным алгоритмам, и „спрашиваем“, кто из спортивных брендов хочет предложить свой продукт? Это происходит в реальном времени. Пока вы заходите на сайт, мы проводим аукцион и в наносекунды продаем рекламу непосредственно на вашем телефоне. Полное таргетирование, полное позиционирование продукта в правильный момент. Booking.com, наш клиент, используя эту технологию сейчас в России, увеличил уровень конверсии в 27 раз, Тинькофф — в 16 раз, Aliexpress — в 17 раз».

Масс-маркет с его формулой «one size fits all», который создавался массовой телевизионной рекламой, стремительно уходит в прошлое. «Люди устали, когда всем предлагается одинаковое, считает Д. Хелд. — Сейчас совершенно другой мир. Людям не интересно то, что им нерелевантно. Прогностические алгоритмы (predictive algorithms) показывают, что вам релевантно, причем это не равно тому, что вы кликнули — то, что вам релевантно, значительно шире».

Обогащение данных

Центр big data, по словам Д. Хелда, в качестве источника информации использует не только данные «Билайн» как оператора связи. Обмен информацией между операторами связи и Интернета позволяет обогащать данные. Для аналитических выводов необходима информация не только о том, как пользователи используют телефон, но и как они используют mail.ru и другие сервисы, а также корреляция между этими данными. «В big data можно быть только партнерами, — считает он, — потому что данные не пересекаются друг с другом. Мы накладываем одно на другое и связываем через predictive algorithms. Мы обмениваемся данными с другими источниками, mail.ru, Google — одни из наших партнеров. Информация, которую мы передаем — обезличенная, это данные не об абоненте, а о некоем паттерне поведения. Мы не продаем информацию о пользователях, мы используем информацию о пользователях с их разрешения, чтобы производить таргетирование».

Этика больших данных

Вопрос, который Хелд считает ключевым в big data, относится вовсе не области технологии или коммерции, а этики. «Многое, о чем я рассказывал, — говорит он, — правильно, потому что в самом деле делает жизнь лучше. Но с big data можно сделать много неэтичных вещей. Когда Сергей Брин с другими русскими ребятами создавал Google, он создал ее под лозунгом Don’t be evil! В big data важно понимать, что то, что мы делаем, не является злом для человечества. У нас есть целый отдел, который рассматривает этический аспект big data. Он может сказать: да, это экономически выгодно и отвечает регуляторной структуре страны, но этически неправильно. И это самый главный фактор. Как у инженеров, у нас постоянно появляются мысли, что еще мы можем сделать. Но многие вещи мы не запускаем, потому что этически они неправильны. Думаю, что в ближайшие 5–7 лет роль, которую во времена Сократа играли философы и философия, возвратится в Университет. Сейчас мы возвращаемся ко времени, когда необходимо видеть с этической точки зрения, куда все движется. Опасность в том, что технологии развиваются настолько быстро, что мы как человечество можем не успевать за ними».

Социальные проекты и ЛизаАлерт

У больших данных огромные возможности для применения в социальной сфере. Билайн сотрудничает с проектом по поиску людей ЛизаАлерт. «Это специфичная для России проблема, — говорит Д. Хелд, — люди теряются в лесах. История, которая поменяла наше отношение в этой проблеме, — девочка Лиза, которая заблудилась в лесу со своей тетей. Их нашли, но было поздно. Отыскать в лесу человека сложно, территории очень большие. Мы работаем с ЛизаАлерт во всех городах России. Для поиска людей в том числе используем дроны с термокамерами, они летают и могут найти человека в лесу. Большие данные играют очень большую роль: мы коррелируем поисковую информацию, геоаналитику, термопринтеры. Уже есть сотни людей, которые были найдены».

Со слов Д. Хелда, сейчас существует саморегулируемое сообщество между тремя крупнейшими операторами, которые обсуждают, как передавать обезличенную информацию о клиентах, чтобы не нарушить этическую и законодательную сторону big data, но дать возможность решить социоэкономические проекты на больших территориях.

Библиотеки будущего — дата-центры

Количество цифровой информации удваивается каждые два года, есть ли верхняя граница, которая скажет «Стоп!» накоплению big data? Дата-центры «Билайн» сейчас заполнены на 60%. «У нас есть еще место, куда ставить серверы для обслуживания, — говорит Д. Хелд, — но количество данных будет увеличиваться. Мы уже готовимся к закону Яровой по хранению данных и думаем, как будем их обслуживать». Библиотеки будущего, считает он, — это дата-центры. Можно наблюдать зарождение этой тенденции в США. Там люди традиционно селятся на East и West Coast, а центр по сравнению с побережьем относительно пустует. И сейчас в центральной части, в особенности на Аризоне, начинает расти огромное количество дата-центров. «Уже сейчас, — говорит Д. Хелд, — этот вопрос должен решаться на уровне глобального человечества. У Amazon, у Apple дата-центры размером с небольшие города, в которых нет людей, там серверы и роботы, которые их обслуживают. Как это будет называться для человечества будущего? Будет ли это robotic park или что-то еще? Количество информации, которое собирается, безусловно, огромно — и оно будет продолжать накапливаться и обслуживаться».


Источник: libinform.ru