Математика для анализа данных

МЕНЮ


Искусственный интеллект
Поиск
Регистрация на сайте
Помощь проекту

ТЕМЫ


Новости ИИРазработка ИИВнедрение ИИРабота разума и сознаниеМодель мозгаРобототехника, БПЛАТрансгуманизмОбработка текстаТеория эволюцииДополненная реальностьЖелезоКиберугрозыНаучный мирИТ индустрияРазработка ПОТеория информацииМатематикаЦифровая экономика

Авторизация



RSS


RSS новости


В продолжение предыдущей статьи «Статистика для анализа данных».

В этом руководстве мы покажет вам как изучать математику для анализа данных и машинного обучения без долгих и дорогих курсов.

Количество математических задач в повседневной работе будет сильно зависеть от должности, которую выбудете занимать в качестве аналитика. Продолжайте читать, чтобы узнать, какие концепции вам нужно освоить, чтобы преуспеть в ваших целях.

Предварительные требования: базовые навыки Python

Чтобы полностью пройти это руководство, вам понадобятся хотя бы базовые навыки программирования на Python. Мы будем изучать математику на прикладном, практическом уровне.

Ранее мы писали о том как изучать Python для машинного обучения. Вы можете ознакомиться с руководством в нашей группе.

Другие языки тоже прекрасны, но примеры будут в Python. Это самый популярный язык в нашей компании и на то есть свои причины.

Математика, необходимая для анализа данных

В первую очередь, каждый аналитик данных должен знать Статистику. По ней у нас есть отдельное руководство «Статистика для анализа данных».

А что еще? Здесь есть нюансы: все зависит от того насколько разнообразны будет задачи, с которыми вы будете работать.

На практике вы чаще всего будете применять готовые решения, особенно на начальном этапе. Для анализа данных написано много библиотек(пакетов)на многих языках программирования.

Тем не менее, на собеседовании вас могут проверить на знание основ линейной алгебры и многомерного анализа. Все потому что вашей команде в какой-то момент может понадобиться адаптировать решение для технологического стека или расширить его функциональность. Для этого вам нужно будет понимать как устроены алгоритмы машинного обучения.

Задачи разработки

Некоторые задачи требуют гораздо более обширных знаний. Например, если вам нужно воплотить математическую идею с «бумаги» в рабочий код. Или если Вы сталкиваетесь с нетривиальными задачами.

Другими словами, вы будете разрабатывать алгоритмы с нуля. В таких случаях, знание линейной алгебры и многомерного анализа вам просто необходимо.

Лучший способ учить Математику для анализа данных

Мы будем изучать задачи линейной алгебры, применяя их в реальных алгоритмах.

Вам нужно ознакомиться или освежить в памяти лежащую в основе теорию. Не нужно читать целый учебник, заострите внимание на ключевых понятиях.

Вот 3 шага к изучению математики, необходимой для анализа и машинного обучения:

  1. Линейная алгебра для анализа данных: матрицы и собственные вектора
  2. Математический анализ: производные и градиенты
  3. Градиентный спуск: создание простой нейронной сетки с нуля

Шаг 1: Линейная алгебра для анализа данных

Многие концепции машинного обучения связаны с линейной алгеброй. Например, для Метода главных компонент нужно знать собственные вектора, а для регрессии требуется умножение матрицы.

Кроме того, машинное обучение часто работает с данными высокой размерности (данные со многими переменными). Этот тип данных лучше всего представлен матрицами.

Вот несколько лучших бесплатных ресурсов, которые мы нашли для изучения линейной алгебры для анализа данных:

  1. Khan Academyпредоставляет короткие практические уроки линейной алгебры. Они охватывают самые важные темы.

2. MIT OpenCourseWare предлагает курс линейной алгебры. Все видео-лекции и учебные материалы включены.

Дополнительно:

3. Linear Algebra Review for Machine Learning (Video Series) Это дополнительные видеоролики с кратким обзором концепций линейной алгебры для курса машинного обучения. Вся серия из 6 частей может быть просмотрена менее чем за 1 час. Рекомендуется, если вам нужно только освежить в памяти знания по линейной алгебре.

4. The Matrix Cookbook (PDF) - Отличный справочный ресурс для матричной алгебры.

Шаг 2: Математический анализ

Математический анализ лежит в основе многих алгоритмов машинного обучения. Производные и градиенты понадобятся для задач оптимизации.

Например, одним из наиболее распространенных методов оптимизации является градиентный спуск.

Вот несколько лучших бесплатных ресурсов, которые мы нашли для изучения математического анализа:

  1. У Khan Academy есть курс с короткими практическими уроками по анализу данных. Его хватит чтобы познакомиться с основными концепциями.
  2. MIT OpenCourseWare предлагает курс математического анализа. Все видео-лекции и учебные материалы включены.

Дополнительно:

3. Multivariable Calculus Review (Video) – Это краткий курс математического анализа в формате решения практических задач. Рекомендуется, если раньше вы уже изучали предмет, и просто хотите освежить знания.

Шаг 3: Простая нейронная сетка с нуля

Это самая интересная часть всего руководства.

Один из лучших способов научиться математике в области анализа и машинного обучения - построить простую нейронную сеть с нуля.

Вы будете использовать линейную алгебру для представления сети и математический анализ для ее оптимизации. В частности, вы будете создавать градиентный спуск с нуля.

Не беспокойтесь слишком много о нюансах нейронных сетей. Это нормально, если вы просто следуете инструкциям и написанию кода. Мы подробно рассмотрим машинное обучение в другом руководстве. А здесь мы больше смотрим на математическую практику.

Следуйте за пошаговыми инструкциями и изучите теорию. В финале у вас будет классный проект, который вы сможете добавить в свое резюме.

Вот несколько хороших пошаговых руководств:

Neural Network in Python -Это отличное учебное пособие, в котором вы можете построить простую нейронную сетку от начала до конца. В нем вы найдете полезные иллюстрации и узнаете как подходит градиентный спуск.

Neural Nets to Recognize Handwritten Digits Рекомендуем этот ресурс! Это бесплатная онлайн-книга, в которой вы познакомитесь с применением нейронных сетей. После прочтения понимаешь принципы работы алгоритмов на интуитивном уровне, и это самый подробный учебник в этом списке.

Implementing a Neural Network from Scratch Более короткий учебник, который также поможет вам шаг за шагом освоить нейронные сети.

Итог:

Аналитик данных- это уникальная и очень интересная специальность. В своей работе вы часто будете сталкиваться с задачами, для успешного решения которых нужно, с одной стороны, изучить теорию, а с другой — начать практиковать использование различных подходов и моделей.

Сообщество data science постоянно растет за счет вступления в него людей из абсолютно разных областей. Их объединяет интерес к решению сложных и нестандартных задач. Наша компания тоже делает вклад в развитие сообщества, мы публикуем статьи, а также вакансии и мероприятия у нас в группе. Для нас самое главное-это готовность учиться и узнавать что-то новое.


Источник: m.vk.com

Комментарии: