ТЕМНЫЕ ДАННЫЕ В ПРОФАЙЛИНГЕ. ЧАСТЬ 1 |
||
МЕНЮ Главная страница Поиск Регистрация на сайте Помощь проекту Архив новостей ТЕМЫ Новости ИИ Голосовой помощник Разработка ИИГородские сумасшедшие ИИ в медицине ИИ проекты Искусственные нейросети Искусственный интеллект Слежка за людьми Угроза ИИ ИИ теория Внедрение ИИКомпьютерные науки Машинное обуч. (Ошибки) Машинное обучение Машинный перевод Нейронные сети начинающим Психология ИИ Реализация ИИ Реализация нейросетей Создание беспилотных авто Трезво про ИИ Философия ИИ Big data Работа разума и сознаниеМодель мозгаРобототехника, БПЛАТрансгуманизмОбработка текстаТеория эволюцииДополненная реальностьЖелезоКиберугрозыНаучный мирИТ индустрияРазработка ПОТеория информацииМатематикаЦифровая экономика
Генетические алгоритмы Капсульные нейросети Основы нейронных сетей Распознавание лиц Распознавание образов Распознавание речи Творчество ИИ Техническое зрение Чат-боты Авторизация |
2024-11-25 13:03 Темные данные – это определение, данное информации, которая не является полной, достоверной и точно относящейся к конкретной интересующей вас теме. Понятие темных данных возникло из аналогии с другим физическим термином – темной материей. Большое количество массы Вселенной состоит из вещества, которое мы никак не можем определить, измерить и изучить… Но оно есть и по разным данным составляет как минимум 27% от общей массы Вселенной, а скорее всего – гораздо больше. Темные данные ведут себя аналогично темной материи: мы не видим их, они не обнаруживаются, но оказывают существенное влияние на наши выводы, решения и поведение. В профайлинге мы должны точно понимать, на основе информации какого качества мы принимаем решения и оцениваем ситуацию. Это один из принципиальных вопросов, на который большинство не обращают внимание. Например, если мы оцениваем психотип человека на основе неполных, неточных и недостоверных данных, которыми мы обладаем о человеке, вероятность ошибки будет огромна. Всего выделяют 15 типов темных данных: ТИП 1. Данные, о которых мы знаем, что они отсутствуют. Они возникают, когда мы знаем, что в данных есть пробелы, скрывающие значения, которые могли быть записаны. При определении психотипа человека это, например, информация о том, как человек ведет себя в других контекстах, в которых мы его не видели. ТИП 2. Данные, о которых мы не знаем, что они отсутствуют. Делая вывод о человеке, на основе чьего-либо мнения, мы например, в принципе не знаем, какой информацией о нем мы не обладаем. ТИП 3. Выборочные данные. Ситуация, когда из всех имеющихся данных, мы выбираем только те, которые нам выгодны и которые чаще всего подтверждают наше мнение. Например, при анализе того, обманывает нас человек или нет, мы склонны рассматривать только те данные, которые прямо или косвенно подтверждают, что он обманывает. И скорее не обратим внимание на сигналы «честности». Иногда бывает наоборот. ТИП 4. Самоотбор. Является частным случаем предыдущего типа. Он проявляется, когда людям дают право самостоятельно решать, что включать в базу данных для анализа, а что нет. И, если не обращать внимание на правила формирования выборки, то может случиться так, что в нее попадет только то, что выгодно исследователю. ТИП 5. Неизвестный определяющий фактор. Иногда критически важный аспект системы совершенно незаметен. Это может привести к установлению ошибочных причинно-следственных связей, ведущий к дальнейшим ошибкам. Например, при анализе поведения мужчины мы видим, что он преимущественно ведет себя истероидно. И посчитаем его истероидом. Но не обращаем внимание, что каждый раз это поведение демонстрируется в присутствии дам, что является критическим фактором ситуации. ТИП 6. Данные, которые могли бы существовать или контрфактуальные данные. Это данные, которые мы бы смогли увидеть, если бы предприняли какие-то другие действия или наблюдали бы за происходящим при других условиях или в иных обстоятельствах. Примером в профайлинге может служить наши безосновательные предположения, как бы данный человек вел бы себя, например, в ситуации стресса. Когда мы не видел этого, но предполагаем и дальнейшие выводы делаем на непроверенном предположении. ТИП 7. Данные, меняющиеся со временем. Время может скрывать данные разными путями. Данные могут перестать соответствовать точному описанию мира, одни факты могут перестать регистрироваться за пределами периода наблюдений, а другие — потому что изменилась их природа, и т.д. Примером в профайлинге и детекции может служить различное функциональное состояние организма в процессе (до, после, во время) полиграфной проверки. ТИП 8. Неверно определяемые данные. Различные определения, даже профессиональные могут быть противоречивыми или со временем меняться. Если мы, например, читаем метанализ посвященный невербальным признакам обмана, но у нас нет уверенности, что все авторы, которые попали в группу анализа, одинаково понимают, что такое «закрытые жесты» или «строгий голос», то гарантии того, что данные метанализа будут корректными, нет. После 50-ти лайков этого поста опубликую вторую часть ? #анализданных, #аналитика, #BigData, #информация, #статистика, #психотип, #КИ, #мэтры, #профайлинг_филатов, #ProProfiling Источник: vk.com Комментарии: |
|