Данные о человеке бывают нескольких типов, и не все они создаются им самим

МЕНЮ


Главная страница
Поиск
Регистрация на сайте
Помощь проекту
Архив новостей

ТЕМЫ


Новости ИИРазработка ИИВнедрение ИИРабота разума и сознаниеМодель мозгаРобототехника, БПЛАТрансгуманизмОбработка текстаТеория эволюцииДополненная реальностьЖелезоКиберугрозыНаучный мирИТ индустрияРазработка ПОТеория информацииМатематикаЦифровая экономика

Авторизация



RSS


RSS новости


Данные о человеке бывают нескольких типов, и не все они создаются им самим. К сожалению, нам никто не объясняет этого — контрагенты, желающие монопольно пользоваться нашими данными ради максимизации своей прибыли и, как следствие, власти, предпринимают все усилия, чтобы не привлекать внимание публики к вопросу о ценности и составе собираемых ими данных, недоговаривать и не отвечать на прямо поставленные и понятные даже простому работяге без научнои? степени в области ИТ вопросы, например «Что конкретно вы обо мне знаете и для каких целей конкретно вы это используете?». Причем если вы думаете, что главная проблема — это «“голые” фотки, утекающие в сеть», вы ошибаетесь. Это лишь верхушка айсберга. Всего я выделил 15 типов данных, и каждыи? день своеи? жизни мы их производим на свет:

1. Автоматически генерируемые данные о местонахождении. Это информация о местонахождении сотового телефона или устройства, с которого вы выходите в сеть или просто держите в кармане. При попадании в зону действия базовой станции сотовой связи неизбежным побочным эффектом будет являться то, что оператор будет точно знать, к какои? именно станции вы подключились, то есть неизбежно получит информацию о вашем примерном, в пределах соты, местоположении — без этого связь невозможна […]

2. Сервисные данные. Это информация, которая необходима сайту или сервису для того, чтобы предоставить вам услугу, — как правило, это имя, фамилия, телефон, адрес доставки и данные кредитной карты. Во многих странах деи?ствует регламент «знай своего клиента» (know your customer, или KYC) — предписание, обязывающее ряд бизнес-структур верифицировать личность клиентов. Это правило пришло из банковского сектора, где его введение оправдывалось борьбой с отмыванием денег и с финансированием терроризма. Впрочем, большинство бизнес-структур, от Amazon до узко- специализированных магазинов, и само горит желанием «узнать своего клиента» как можно ближе. […]

3. Добровольно публичные контролируемые данные. Это информация, которую вы оставляете в Сети добровольно, осознанно, проактивно и хотите, чтобы она была публичной, доступной общественности. При этом вы, как производитель данных, имеете над их доступностью полный контроль. Речь идет, например, о постах, статьях на сайтах СМИ, видеоблогах YouTube, фотографиях в Instagram, профиле в LinkedIn и т.д. К этой же категории относятся публичные комментарии, данные от своего имени, например, в социальной сети или сообщение в мессенджере. Впрочем, слово «полный», может, и не совсем верно отражает ситуацию, так как в большинстве пользовательских соглашений, например в Facebook, прямым текстом написано, что вы даете компании лицензию, не требующую лицензионных отчислений, на использование создаваемого вами контента по ее усмотрению, даже если вы потом удалите свои посты.

4. Добровольно публичные, но неконтролируемые данные. Существуют определенные платформы, на которых ваши комментарии к чужим постам вами не контролируются, вы не можете их удалять или редактировать. К неконтролируемым данным можно отнести и метаданные мессенджеров — многие из них зашифрованы, но сам факт общения абонентов А и В навсегда остается в архивах компании.

5. Биометрические данные. Рынок носимых устройств растет (фитнес-браслеты, измеряющие пульс, сканеры отпечатков пальцев и рисунка радужной оболочки глаза, сенсоры голоса и голосового управления и т. д.), а у нашего тела существует довольно много показателей активности и уникальных идентификаторов. Когда вы подтверждаете покупку отпечатком пальца, уникальный «почерк» вашего организма математически превращается в цифровой ключ или команду. […]

6. Атрибутированные данные. В сети существует информация о вас, которую создают другие люди, и вы об этом можете даже не знать. Например, если ваш друг написал о вас пост и не сказал вам, — значит, существует кусочек информации о вас, к созданию которого вы не имеете никакого отношения. Таких данных особенно много в корпоративных сетях, где анализ внутренних форумов, приложений и статистики использования сервисов может рассказать очень многое.

7. Поведенческие данные. Когда вы делаете что-то на сайте (двигаете мышкой и задерживаете ее на определенных элементах экрана, в определенной последовательности кликаете по пунктам меню, фотографиям продуктов, печатаете текст, ищете что-то, а после поиска идете в магазин пешком), вся эта информация собирается, анализируется и преобразуется в математический портрет ваших предпочтений и увлечений. Например, интернет-магазин таким образом понимает, какие товары имеет смысл вам предложить, если вы кликали по продуктам A, B и С. Или долго водили мышкой по D, но так и не добавили в корзину покупок.

8. Психологические данные. Психология — довольно точная наука, тесты и классификаторы людей по психотипам и, следовательно, возможным паттернам поведения применялись еще до появления интернета — при приеме на работу на ответственные посты, особенно в государственных органах, в маркетинге (например, цветовые опции автомобилей формируются исходя из психологических предпочтений потенциальных покупателеи?), да и много где еще. Обычно для психологического профилирования человека необходимо проходить нудные тесты из десятков, а иногда и сотен вопросов, кликать по разноцветным картинкам и отвечать на глупые вопросы в лучших традициях теста Вои?та-Кампфа. Но интернет все это упростил — в нем теперь легко найти тексты ваших постов и сообщении?, фотографии, которые вы публикуете в своем блоге и в социальных сетях, комментарии к новостям и внешнему контенту, вскрывающие ваши истинные реакции. В итоге дата-брокеры и другие компании, имеющие доступ к разным источникам и каналам получения ваших данных, могут вполне точно определить ваше психологическое состояние, предрасположенность к риску или пассивному поведению […]

9. Медицинские данные. Показатели медицинского уровня кардиодатчиков, глюкометров для измерения уровня глюкозы в крови, нательных термометров, умных ингаляторов для астматиков, анализирующих состав остаточного воздуха в легких, данные о визитах к врачам, анамнезе, результатах анализов, выписанных лекарствах, наличии у вас аллергий, фобий и психических отклонений — вся эта информация в большинстве развитых стран давно компьютеризирована и хранится исключительно в цифровом виде.

10. Расшифрованная ДНК. За какие-то $99 можно сделать анализ ДНК и получить его в цифровом виде. Главный игрок рынка — компания 23andMe. Она проводит полный анализ и выдает на основе вашей ДНК историю и географию предков и еще много интересного, а за дополнительные деньги можно получить полный медицинский анализ ДНК, в котором детально расписаны предрасположенности к определенным болезням. Эти данные можно использовать в повседневной жизни — для эффективной диагностики и профилактики потенциальных болезней, поиска родственников, смертельных аллергий и т.д. К сожалению, стоимость сервиса не мешает компании вдобавок получать все права на результаты анализа вашего ДНК — использовать его и монетизировать дальше. […]

11. Данные, основанные на выводах(collateral data). Это данные, суть которых прекрасно отражает древняя народная мудрость «Скажи мне, кто твой друг, и я скажу, кто ты». Например, если у вас на Facebook или во «ВКонтакте» 70% подписчиков — геи, значит, с высокой степенью вероятности, вы тоже. Если 80% ваших запросов в поисковике связаны с музыкальными инструментами, студиями и музыкой, — вы, вероятно, музыкант. Выводы, которые можно делать на сложных данных, поразительны. Например, Facebook может с высокой степенью вероятности предсказать, за какого кандидата будет голосовать тот или иной пользователь в своей стране. А ваш сотовый оператор при желании может узнать, изменяете ли вы жене/мужу, так как знает, кому, когда и откуда вы звоните и с какими контактными лицами пересекаетесь в пространстве (если они пользуются услугами того же оператора).

12. Секретно собираемые данные. В этои? книге я не буду слишком подробно останавливаться на данных, собираемых спецслужбами, и их методах. Об этом довольно детально рассказал всем Эдвард Сноуден, и мы чуть позже остановимся лишь на некоторых аспектах работы спецслужб, о которых надо знать каждому человеку. Просто имеи?те в виду, что у спецслужб и очень квалифицированных хакеров всегда есть теоретическая возможность удаленно подключиться к вашему компьютеру и включить камеру или микрофон без вашего ведома, записать все, что вы печатаете, или таи?но сделать скриншот рабочего окна. […]

13. Данные семьи/рода. Мы рождаемся и умираем подключенными к Сети. Чего многие из нас пока не осознали — так это того, что данные родителей могут привязываться к данным их детей, и наоборот. Началась эпоха трекинга даже не одного конкретного человека, а целого рода, семейного древа. Иосиф Сталин лицемерно заявлял: «Сын за отца не отвечает». Это было неправдой и тогда, в 1935 году, и может оказаться неправдой в будущем. Вскоре о благонадежности человека в числе прочих показателей могут начать судить по скорингу поведенческой активности всей его семьи.

14. Служебные данные. Почти каждый из нас ежедневно выступает в разных ролях (как говорят англичане, wearing multiple hats — «носит разные шляпы»). Человек в семье и он же, но на работе, — разные люди. Сотрудник крупной транснациональной корпорации в рабочее время пользуется служебными устройствами и программами, служебными учетными записями, файлами, документами и т.д. Анализ этих данных гораздо больше говорит о конкретной должности, иерархии, инфраструктуре и положении дел в компании, чем о человеке. Но навредить ему эти данные могут. Они представляют огромную ценность для промышленных шпионов и хакеров, занимающихся таргетированными атаками.

15. Полученные/доступные знания. Поведение человека во многом определяется тем, какие знания он усвоил, а какие нет. Обученный трейдер будет успешнее играть на рынке акций, чем художник, не знающий азов алгебры и статистики. Человек, читавший Айзека Азимова, будет лучше осведомлен об опасностях ИИ и его реакции. Информация об объеме ваших знаний и вашей способности их усваивать имеет огромную ценность. По аналогии, не меньшую ценность имеет информация о том, какие знания вам на 100% недоступны.

Все эти 15 типов данных так или иначе собираются о вас в режиме реального времени. Какие-то компании получают больше, какие-то меньше, но собирают практически все, и достаточно большая часть собранного в итоге оказывается в руках топ-5 дата-компаний мира (Google, Facebook, Apple, Microsoft и Amazon — так называемая большая пятерка) — дата-брокеров, выставляющих на продажу целые психологические портреты, хорошо структурированные под все нужды заказчиков. Нас продают как породистых собак или дойных коров, оптом — базы данных содержат информацию по полу, возрасту, интересу к спорту, шахматам или нетрадиционному сексу; в них вы можете отыскать голосующих за демократов или республиканцев, представителей всех религий и конфессий, фанатов «Звездных войн», отшельников, любителей водки и пельменей, техасских рейнджеров, молодых матерей, растящих детей без отцов, членов ЛГБТ-комьюнити, проблемных заемщиков, радикально настроенных правых... и еще сотни, тысячи групп.

(отрывок из книги Евгения Черешнева "Форма жизни №4", длинный список премии "Просветитель" 2022 http://www.premiaprosvetitel.ru/booksauthors/view/?547)


Источник: www.premiaprosvetitel.ru

Комментарии: