Как связаны Гипотезы, Теории, Исследовательские вопросы и Предметная область?

МЕНЮ


Главная страница
Поиск
Регистрация на сайте
Помощь проекту
Архив новостей

ТЕМЫ


Новости ИИРазработка ИИВнедрение ИИРабота разума и сознаниеМодель мозгаРобототехника, БПЛАТрансгуманизмОбработка текстаТеория эволюцииДополненная реальностьЖелезоКиберугрозыНаучный мирИТ индустрияРазработка ПОТеория информацииМатематикаЦифровая экономика

Авторизация



RSS


RSS новости


«Процесс расширения познаний о мире состоит из двух этапов: размышлений о Теории* и постановки Исследовательского вопроса*. Любой из них может быть первым.

*Теория — объясняет то, почему происходят явления, которые мы наблюдаем, или иным образом обобщает эти наблюдения на другую ситуацию. Наличие теории просто означает, что где-то скрывается «почему» или «потому что». Ваша теория не обязательно должна быть громкой, как теория гравитации или теория эволюции. Теория может звучать как простое умозаключение типа «хлеб сегодня стоит дороже, чем в прошлом году, потому что цены на хлеб в целом со временем растут».

*Исследовательский вопрос — ведет нас от Теории к Гипотезе*, где *Гипотеза представляет собой конкретное утверждение о том, что мы будем наблюдать в мире.

То есть исследовательский вопрос должен быть таким, чтобы ответ на него помогал улучшить ваше объяснение «Почему»: исследовательский вопрос в сочетании с ответом должен рассказать вам о чем-то новом, раскрыть более широкий взгляд на мир, вопрос должен тем или иным способом формировать теорию.

*Гипотеза — конкретное утверждение о том, что вы увидите в данных.

Простыми словами: *Гипотеза – это предположение, которое мы выдвигаем в попытке объяснить что-то необъясненное. *Теория — это совокупность взаимосвязанных утверждений, которая описывает некоторую предметную область.

Три примера:

— Теория: «Я думаю, что люди перестали покупать компакт-диски, потому что скачивают музыку в интернете»

— Исследовательский вопрос: «Популярны ли компакт-диски в регионах с плохим доступом к интернету?»

— Теория: «Я думаю, что люди принимают решения, потому что они стремятся получить вознаграждение»

— Исследовательский вопрос: «Будут ли ученики усерднее учиться в школе, если платить им за хорошие оценки?»

| А может вы имели ввиду совсем другую теорию. Возможно, вы предполагаете, что поведение человека зависит от стимулов? Важно самим хорошо понимать, почему задали этот вопрос.

— Теория: «Я думаю, что растения не нуждаются в пищеварительной системе, потому что они поглощают энергию солнца»

— Исследовательский вопрос: «Погибнут ли растения, если держать их в темной комнате?»

Еще два примера:

Пример 1. Возьмем, к примеру, теорию микробов. Теория микробов утверждает, что микроорганизмы, такие как бактерии и вирусы, могут вызывать заболевания. Это объясняет, почему у нас есть определенные болезни, а также почему болезнь может передаваться от одного человека к другому.

Пример 2. Даже водород – это теория: она утверждает, что такой материал, как вода, имеет определенные свойства, потому что существует тип атома, который ведет себя определенным образом и имеет определенную структуру.

Мы называем это объяснение теорией вовсе не потому, что сомневаемся в его правильности. Мы говорим, что это теория, поскольку она отвечает на вопрос «почему». Теории, которые в нашем понимании почти наверняка верны, принципиально ничем не отличаются от теорий, которые почти наверняка ошибочны.

Почему интеллектуальный анализ данных (Data Mining in Business Intelligence) плохо работает с теорией?

Есть несколько основных причин. Одна из них заключается в том, что интеллектуальный анализ данных по определению фокусируется на том, что находится в данных, а не на том, почему это оказалось в данных.

Другими словами, он великолепно выявляет корреляции закономерности, связанные с тем, как наблюдаемые переменные изменялись вместе в прошлом, – но эти корреляции могут иметь мало общего с причинно-следственными связями или пониманием того, почему эти переменные изменялись вместе.

Приведу пример, который несколько раз будет встречаться в этой книге:

Специалист по интеллектуальному анализу данных, попытавшись понять закономерности продаж мороженого, легко может заметить, что доля людей, носящих шорты, является фантастически точным предиктором динамики продажи мороженого.

Но дело ведь не в том, что люди в шортах более охотно покупают мороженое. Они покупают мороженое и носят шорты, потому что жарко.

Но для аналитика наблюдаемая корреляция между ношением шорт и поеданием мороженого весьма привлекательна! В конце концов, вычисление доли людей в шортах может стать отличным способом предсказать продажи мороженого, даже если он не отвечает на вопрос «почему».

Однако если нас интересует не предсказание продаж мороженого, а объяснение того, почему продажи мороженого коррелируют с ношением шорт, возникает большое искушение попытаться придумать историю, поясняющую, почему люди в шортах чаще едят мороженое. В случае с мороженым и шортами мы можем сказать, что это смешно, но ситуация становится намного сложнее, когда мы не знаем, что смешно, а что является важным открытием.

Разберем как работает интеллектуальный анализ данных на примере стула

Интеллектуальный анализ данных на самом деле не занимается абстракцией, поскольку он максимально сосредоточен на данных.

Например, взгляните на стул. Откуда вы знаете, что это стул? У него, вероятно, есть ножки, может быть, спинка, плоская зона для сидения, и он всем своим видом явно предназначен для сидения.

Это наша «теория стула» – мы предполагаем, что существуют объекты, называемые стульями, которые обладают определенными свойствами стула, и объединенные возможностью сидеть на них на некотором расстоянии от земли. Стул, на который вы сейчас смотрите, – один из примеров теории стульев.

Но что на самом деле содержится в данных?

Там нет слова «стул». Есть только плоская площадка и несколько прямых частей сверху и снизу этой площадки. Интеллектуальный анализ данных может пригодиться, если нам важно обнаружить наличие вертикальных деталей выше и ниже горизонтальной площадки, но бесполезен для разработки «теории стула» , потому что не может перейти от конкретных данных к абстрактному назначению стула – возможности сидеть на нем.

Специалист по интеллектуальному анализу данных применив классические инструменты и подходы не может догадаться, что стул на четырех ножках имеет какое-то отношение, скажем, к креслу-мешку, у которого вообще нет выраженных ножек и спинки. Ложные взаимосвязи – еще одна причина, почему интеллектуальный анализ данных может быть опасным.

Существуют способы избежать ложных закономерностей при интеллектуальном анализе данных. Это одна из важнейших тем в области науки о данных, и ученые придумали много разных методов. Но если вы просто наобум просматриваете набор данных, то, скорее всего, в конечном итоге получите массу ложных закономерностей вперемежку с реальными. У вас не будет возможности отличить одно от другого.

Среди популярных способов избежать ложных закономерностей – «перекрестная проверка» и «наборы для обучения и тестирования». Если это вас интересует, вы можете узнать больше, по этому вопросу есть много литературы из области data science.

Тем не менее с анализом данных не все так плохо. Интересные теории для проверки не появляются из ниоткуда.

Множество теорий возникают в результате изучения данных, обнаружения закономерности и размышлений о том, почему она проявляется и реальна ли она вообще.

Интеллектуальный анализ данных хорош, когда уместен. Но это плохой последний шаг, если вы пытаетесь объяснить мир. Он по-прежнему может служить источником идей. И кто знает – возможно, вы заработаете на нем миллиарды долларов, как это сделали разработчики Insta (первая версия Insta называлась Burbn и была заточена на чекин), Flickr (в первой версии был частью многопользовательской онлайн-игры Ludicorp Game Neverending), а также Youtube (в первой версии был как Сервис знакомств на основе видеопрофайлов).

PS.

Задавать вопросы легко. Просто заговорите с любым пятилетним ребенком, и он задаст вам десятки вопросов. Гораздо сложнее придумать хороший исследовательский вопрос.

Разница, по крайней мере в случае Количественного *эмпирического исследования, заключается в том, что исследовательский вопрос – это вопрос, на который (a)можно ответить, причем (b)ответ улучшит ваше понимание того, как устроен мир.

*Эмпирический — простыми словами: когда что-то получено опытным путём, а результаты оцениваются через органы чувств, в частности, путём наблюдения.

(a)Что значит иметь вопрос, на который можно ответить? Это означает, что существует некий набор свидетельств (или доказательств), исходя из которых, можно получить однозначный и проверяемый ответ.

(b) Исследовательский вопрос должен быть таким, чтобы ответ на него помогал улучшить ваше объяснение «почему».»

(c) Ник Хантингтон-Клейн: В поисках эффекта. Планирование экспериментов и причинный вывод в статистике | The Effect. An Introduction to Research Design and Causalit


Источник: vk.com

Комментарии: