Топ-5 для начинающих аналитиков Big Data

МЕНЮ


Искусственный интеллект
Поиск
Регистрация на сайте
Помощь проекту

ТЕМЫ


Новости ИИРазработка ИИВнедрение ИИРабота разума и сознаниеМодель мозгаРобототехника, БПЛАТрансгуманизмОбработка текстаТеория эволюцииДополненная реальностьЖелезоКиберугрозыНаучный мирИТ индустрияРазработка ПОТеория информацииМатематикаЦифровая экономика

Авторизация



RSS


RSS новости


Аналитик Big Data — звучит гордо и невероятно модно в наше время.

Но не смотря на популярность профессии только 4 из 100 начинающих аналитиков понимают, что они делают и что им ещё предстоит делать.

Математический склад ума и понимание принципов экономики — лишь верхушка айсберга. Времена, когда аналитики занимались только расчетами прошли: теперь аналитик должен обладать не только знаниями математического аппарата, но и пониманием бизнес-процессов, психологии, знанием текущих трендов рынка и множества других факторов, влияющих на бизнес прямо сейчас.

Он должен прогнозировать, визуализировать и строить стратегию, исходя из увиденных им тенденций.

Звучит сложно?

Но не стоит отчаиваться, все эти навыки вы можете при желании прокачать.

Мы подготовили для вас ТОП-книг которые помогут начать путь в верном направлении.

Naked Statistics: Stripping the Dread from the Data

Автор: Charles Wheelan

  • Как Netflix определяет, какие фильмы вам понравятся?
  • Какое поведение является правильным при решении «Парадокса Монти Холла»?
  • Как определить, какие привычки и поведение вызывают рак, не ставя эксперименты на людях?
  • Помогает ли пациентам то, что кто-то молится за них?
  • Есть ли экономические выгоды от получения ученой степени?

На все эти вопросы способна ответить статистика. В данной книге автор рассматривает статистические правила и формулы не на сухих цифрах, а на живых примерах из нашей повседневной жизни.

Он также затрагивает важнейшую мысль, которую должен усвоить каждый аналитик: тот кто владеет информацией, несёт большую ответственность. Искажение и изменение данных способно навредить не меньше физического воздействия.

Everybody Lies: Big Data, New Data, and What the Internet Can Tell Us About Who We Really Are

Автор: Seth Stephens-Davidowitz

В жизни нередко возникают ситуации, когда продуктовая команда проводит исследование, подтверждает гипотезу, но после выхода нового релиза в мир, фактические показатели расходятся с прогнозом кардинально.

Статистическая ошибка? Неправильный выбор групп для исследования?

Все намного проще: все лгут.

В данной книге ситуация рассматривается с позиции пользователей и аналитиков. Автор книги утверждает: исследования и опросы дают ложные данные, потому что люди скрывают правду.

В интернете же люди не скрываются, они ищут в Google идеи для свиданий и симптомы болезней, рассказывают интернету всё, что у них в голове. Знание этого помогает аналитикам создавать точные модели.

Осталось лишь найти применение этим знаниям.

Мы узнали, как собирать и анализировать информацию. Где искать правдоподобные данные и на что стоит обратить внимание в исследованиях. Переходим к реальным действиям.

Python for Data Analysis: Data Wrangling with Pandas, NumPy, and IPython

Автор: Wes McKinney

Эта книга хороша тем, что не только даёт базовые знания о группировании данных и временных рядах, но и упражнения, которые помогут применить Pandas в реальности. В книге сказано, что она поможет разобраться в «манипуляции, преобразовании, чистке и обработке данных с помощью Python».

Это книга о тех частях языка Python и библиотек для него, которые необходимы для эффективного решения широкого круга аналитических задач: интерактивная оболочка IPython, библиотеки NumPy и pandas, библиотека для визуализации данных matplotlib и др.

Data Science from Scratch: First Principles with Python

Автор: Gras Joel

Как и предыдущий автор, Грас Джоэл рассматривает обработку данных на Python, а также даёт практические методы сбора и обработки естественного языка, методы анализа социальных сетей, основы баз данных, SQL и MapReduce.

Она написана так, что способствует погружению в профессию Data Science аналитика, даже если вы не обладаете глубокими знаниями в этой прикладной дисциплине.

Книга содержит интенсивный курс языка Python, элементы линейной алгебры, математической статистики, теории вероятностей, методов сбора, очистки, нормализации и обработки данных — в объемах, достаточных для начала работы в области Data Science. В ней также описываются основы машинного обучения. Описаны различные математические модели и их реализация по методу k-ближайших соседей, наивной байесовской классификации, линейной и логистической регрессии, а также модели на основе деревьев принятия решений, нейронных сетей и кластеризации.

Doing Data Science

Авторы: by Cathy O'Neil and Rachel Schutt

Мы решили закончить нашу подборку, книгой которая позволит упорядочить все полученные знания.

Эта книга основана на вводном курсе по Data Science из Колумбийского университета и начинающему специалисту-аналитику она совершенно необходима.

Эта книга увлекательно и доступно рассказывает о:

  • Байесовском методе;
  • Статистических алгоритмах;
  • Финансовом моделировании;
  • Рекомендательных движках;
  • Визуализации данных;
  • MapReduce.

Издание посвящено углубленному изучению фильтрации спама, регрессионных моделей, рекомендательных машин и введению в Big Data.


Источник: m.vk.com

Комментарии: