Data Science онлайн: все, что вам нужно знать. Часть 1.

МЕНЮ


Искусственный интеллект
Поиск
Регистрация на сайте
Помощь проекту

ТЕМЫ


Новости ИИРазработка ИИВнедрение ИИРабота разума и сознаниеМодель мозгаРобототехника, БПЛАТрансгуманизмОбработка текстаТеория эволюцииДополненная реальностьЖелезоКиберугрозыНаучный мирИТ индустрияРазработка ПОТеория информацииМатематикаЦифровая экономика

Авторизация



RSS


RSS новости


Это полная карта с онлайн-ресурсами о Data Science

Если вы хотите учиться бесплатно или более эффективно , это руководство проведет вас через пошаговый процесс, который выведет вас на правильный путь. Мы поговорим о навыках, онлайн-курсах, книгах и других ресурсах .

В данной статье:

  • основы Data Science(Python, SQL, машинное обучение/статистика) и как их изучать.
  • Почему и как построить портфолио науки о данных .
  • другие советы / ресурсы, чтобы погрузиться в мир науки о данных.

Шаг #0: получить представление о Data Science

Почему Data Science? Должен ли я попасть в эту область?

Представьте:

  • вы можете исследовать мир на основе анализа данных, чтобы обнаружить шаблон / истину.
  • вы можете влиять на мир, используя передовые технологии, алгоритмы машинного обучения .
  • у вас есть хорошая зарплатная работа , которую вы страстно любите .

Посмотрите эти видео на платформе YouTube, чтобы получить лучшее представление о науке данных:

  • Что же такое На самом деле наука о данных? Рассказано ученым по данным
  • Демистификация данных науки: TED talk
  • Прогнозирование Цен На Акции

Имейте в виду, что Data Science может быть полезна для многих различных отраслей промышленности, таких как:

  • робототехника
  • маркетинг
  • финансы
  • здравоохранение

И его можно использовать для много различных применений, как:

  • аналитика
  • прогнозирование
  • классификация
  • рекомендация
  • обработка естественного языка (НЛП)

Шаг #1: изучение основ Data Science

Наука о данных является гибридом между различными областями, в том числе информатики, статистики, информатики, математики. Таким образом, вы должны иметь как навыки программирования, так и теоретические знания.

Каковы основы Data Science, которые мы должны знать?

В конце концов, вся тяжелая работа заключается в том, чтобы начать карьеру в области науки о данных. Вы можете задаться вопросом, что хотят работодатели:

Какие языки/инструменты Data Science актуальны?

Что является минимальным требованием для получения образования?

Каковы самые высокие навыки нужно освоить?

Ознакомьтесь с сообщением каковы востребованные навыки для исследователей данных в 2020 году, чтобы найти ответы.

Для начала, мы сосредоточимся на технических навыках ниже:

  • Python
  • SQL
  • Машинное обучение (включая основы статистики)

Наука о данных онлайн курсы

Какие курсы выбрать из множества различных?

Мы предоставили подробные рекомендации по каждой теме Python / SQL / машинного обучения .

  • Сосредоточение на основах
  • Интерактивной среда Python / SQL / R
  • Большой раздел научных проектов

Попробуйте DataCamp

  • можно изучить некоторые курсы в течение определенного времени бесплатно
  • сертификаты доступны с оплатой
  • в основном преподается профессорами из колледжей / университетов, таких как MIT, Гарвард

Попробуйте edX

  • можете изучить некоторые курсы бесплатно
  • сертификаты доступны с оплатой
  • в основном преподается профессорами из широкого спектра лучших колледжей / университетов

Попробуйте Coursera

  • есть самый большой выбор курсов
  • хорошие системы ознакомления

Попробуйте Udemy

  • созданный и признанный ведущими технологическими компаниями, такими как Google, AWS, IBM
  • более подробно: 4-5 месяцев (5-10 часов в неделю)
  • имеет реальные проекты, которые рассматриваются
  • техническую поддержка ментора
  • персональная карьера

Попробуйте Udacity

Python

Python является наиболее востребованным языком науки о данных, плюс он является бесплатным для использования. Это мощный язык, который может помочь вам достичь большинства задач с данными науки, и даже больше!

R-это еще один популярный язык науки о данных. Тем не менее, если вы все еще боретесь с выбором между R или Python, прочитайте, какие навыки востребованы для исследователей данных в 2020 году .

Основываясь на нашем опыте, мы составили список вещей, которые имеют важное значение для науки о данных:

  • числовой тип
  • тип Boolean
  • списки
  • наборы
  • словари
  • функции
  • даты
  • файлы
  • обработка строк
  • условные обозначения-if / else
  • петли
  • пакеты-установщики, импорт и т. д

DataCamp

Качество Контента / Охват: 4/5

Доступность: $

Рекомендуемые Курсы:

курсы предлагаются в модулях,
поэтому нужно все следующее:
-введение в Python
-промежуточный Python
-написание эффективного кода Python
-работа с датами и временем в Python

edX

Качество Контента / Охват: 4/5

Доступность: аудит на некоторое время бесплатно или
заработать сертификат на $

Рекомендуемые курсы: Python Basics for Data Science

Coursera

Качество Контента / Охват: 3.5 / 5

Доступность: аудит бесплатно или
заработать сертификат для $$

Рекомендуемые курсы: Python для всех специализация

Udemy

Качество Контента / Охват: 4.5 / 5

Доступность: $$$

Рекомендуемые курсы: завершить Python Bootcamp: перейти от нуля до героя в Python 3

Udacity

Качество Контента / Охват: 5/5

Доступность: $$$$$

Рекомендуемые курсы: Программирование для Data Science с использованием Python

SQL

SQL является классическим и до сих пор доминирующим языком для извлечения данных из баз данных. Большинство компаний имеют данные в базах данных, что делает SQL необходимым навыком для науки о данных.

Основываясь на нашем опыте, мы составили список вещей, которые имеют важное значение для науки о данных:

  • выборка
  • фильтр
  • инертные материалы
  • группа by
  • подзапросы
  • выражения
  • создавать таблицы
  • индексы / ключи
  • оконная функция
  • схемы таблиц базы данных

DataCamp

Качество Контента / Охват: 5/5

Доступность: $

Рекомендуемые Курсы:

курсы предлагаются в модулях, поэтому нужно все следующее:
- введение в SQL
-объединение данных в SQL
-промежуточный SQL
-исследовательский анализ данных в SQL
-сводная статистика PostgreSQL и оконные функции
-введение в реляционные базы данных в SQL

edX

Качество Контента / Охват: 4/5

Доступность: аудит на некоторое время бесплатноили
заработать сертификат на $

Рекомендуемые курсы: SQL for Data Science

Coursera

Качество Контента / Охват: 4/5

Доступность: аудит бесплатноили
заработать сертификат для $$

Рекомендуемые курсы: SQL for Data Science

Udemy

Качество Контента / Охват: 4/5

Доступность: $$$

Рекомендуемые курсы: полный SQL Bootcamp

Udacity

Качество Контента / Охват: 3.5 / 5

Доступность: бесплатно

Рекомендуемые курсы: SQL для анализа данных

Машинное обучение / Статистика

Машинное обучение - это то, о чем люди говорят больше всего о науке о данных. Мы оставляем его в конце, так как он требует навыков программирования, чтобы применить свои алгоритмы. Курсы машинного обучения, как правило, также включают в себя базовую концепцию статистики.

DataCamp

Качество Контента / Охват: 4/5

Доступность: $

Рекомендуемые Курсы:

курсы предлагаются в модулях, поэтому необходимо все следующее:
- машинное обучение с древовидными моделями в Python
-анализ временных рядов в Python
-линейные классификаторы в Python
-кластерный анализ в Python
-экстремальный градиентный бустинг с XGBoost
-введение в глубокое обучение с Keras

edX

Качество Контента / Охват: 3/5

Доступность: аудит на некоторое время бесплатноили
заработать сертификат на $

Рекомендуемые курсы: анализ данных с помощью Python

Coursera

Качество Контента / Охват: 4/5

Доступность: аудит бесплатноили
заработать сертификат для $$

Рекомендуемые Курсы:

Оба являются более теоретическими и менее прикладными:
-прикладная наука о данных со специализацией Python или-машинное обучение Эндрю Нг (не в Python)

Udemy

Качество Контента / Охват: 3.5 / 5

Доступность: $$$

Рекомендуемые курсы: машинное обучение, наука о данных и глубокое обучение на Python

Udacity

Качество Контента / Охват: 5/5

Доступность: $$$$$

Рекомендуемые Курсы:

Обе степени являются очень всеобъемлющими и практичными:
Data Analyst Nanodegree
Data Scientist Nanodegree

Data Science бесплатные онлайн-уроки

Есть также некоторые бесплатные онлайн письменные уроки. Они хороши в качестве ссылок, так как они основаны на тексте и легко доступны для поиска. Но они часто неструктурированы, как курсы/книги.

Python

Мы рекомендуем онлайн-курсы для людей без опыта программирования. Но, если у вас есть опыт программирования, отличный от Python, вы будете отлично учиться сами.

Ознакомьтесь с нашей публикацией для получения пошаговых инструкций по настройке среды: Как установить / настроить Python и Prep for Data Science прямо сейчас .

И посмотрите на W3school Python Tutorial или Python Doc.

SQL

Как и Python, существует также W3school SQL учебник. Взгляните, чтобы изучить основы.

PostgreSQL и MySQL-это бесплатные СУБД с открытым исходным кодом. И они также распространены в реальных производственных средах. Вы можете попробовать установить их и практиковаться с образцами баз данных:

  • Примеры баз данных PostgreSQL
  • Примеры баз данных MySQL

Научные книги

Чтение-это традиционный способ обучения.

Мы рекомендуем читать книги, которые являются либо базовыми, либо только сосредоточенные на определенных темах. Содержание более глубокого программирования иногда может устареть.

https://proglib.io/p/ai-and-datascience/

На данном сайте вы можете посмотреть книги по данным темам

Надеемся вам было интересно!
?
Не забывайте регистрироваться на Хакатон и попробовать себя в Machine Learning
https://leader-id.ru/event/45900/?_pjax=#pjax-container?

https://towardsdatascience.com/

https://proglib.io/p/ai-and-datascience/

https://www.justintodata.com/in-demand-skills-for-data-scientists/

https://www.justintodata.com/


Источник: m.vk.com

Комментарии: