Как освоить Data science

МЕНЮ


Искусственный интеллект
Поиск
Регистрация на сайте
Помощь проекту

ТЕМЫ


Новости ИИРазработка ИИВнедрение ИИРабота разума и сознаниеМодель мозгаРобототехника, БПЛАТрансгуманизмОбработка текстаТеория эволюцииДополненная реальностьЖелезоКиберугрозыНаучный мирИТ индустрияРазработка ПОТеория информацииМатематикаЦифровая экономика

Авторизация



RSS


RSS новости


По данным HeadHunter, количество вакансий в сфере Data Science с 2015-го по 2018-й год выросло в 7 раз. Рассказываем, какие онлайн-курсы, книги и программы помогут стать специалистом в этой науке без получения специального высшего образования.

Tanner Wayment / Dribbble

С чего начать

Если вы хотите работать с данными, то начните с просмотра видеокурсов. Выбрать их можно по рейтингу на Coursera.org. Среди подходящих курсов есть «Машинное обучение и анализ данных» от Яндекса и МФТИ и «Машинное обучение» от Стэнфордского университета. Есть также видеолекции от Школы анализа данных Яндекса, но они сложней, и смотреть их первыми не стоит. Они дают глубокое понимание предмета, но требуется хорошая математическая подготовка.

Программирование

Для анализа данных нужно иметь навыки программирования на языке Python. Можно проходить отдельные онлайн-курсы или изучать Python в курсах по машинному обучению. Так, в состав специализаций от Яндекса и МФТИ уже входят основы программирования.

Лучше всего сразу начать практиковаться. Для этого существует платформа Datacamp. Здесь есть видеолекции, после которых вы можете выполнять задания по программированию с автопроверкой.

Когда у вас еще нет навыка программирования, вы можете использовать Студию машинного обучения Azure от Microsoft. Здесь вы будете строить алгоритмы – это графическое программирование. Станет ясно, как архитектурно устроены решения по анализу данных. Однако на практике все-таки чаще используется Python.

Книги

Когда вы посмотрели курсы и научились программировать, можете приступать к чтению. Советуем научно-популярную книгу П. Домингоса «Верховный алгоритм», а также книги «Статистика и котики» В. Савельева, «Искусственный интеллект. Современный подход» С. Рассела и П. Норвига, «Машинное обучение» Х. Бринка, Д. Ричардса и М. Феверолфа. В книгах есть математика, поэтому стоит заняться и ей.

Ihor Hedz / Dribbble

Математика

Для начала школьных знаний по математике вам хватит, но если вы хотите работать на более серьезном уровне, то лучший способ – скачать учебник по высшей математике. Для анализа данных требуется в основном дискретная математика: это графы, комбинаторика. Также нужна статистика и понимание того, как работают матрицы. Интегралы и дифференциальные уравнения обычно не требуются.

Можете также смотреть видеолекции. В том же курсе от Яндекса и МФТИ есть математика.

Практика

Когда вы получите все необходимые знания, начинайте решать задачи по анализу данных. Для практики используйте ресурс Kaggle. Здесь проходят соревнования по анализу данных. В тех, которые уже закончились, тоже стоит участвовать для самопроверки. С площадки можно скачать данные и попробовать применять разные навыки, предобработать данные, настроить алгоритм, посмотреть, какие показатели от каких зависят, где какой шум. Главное, вы можете сравнить результат вашего решения с результатами других участников.

В соревнованиях Kaggle участвуют специалисты со всего мира. Здесь они также выкладывают свои решения и объясняют их.

Если вы хотите увидеть, как люди на практике решают задачи с Kaggle, посмотрите тренировки по машинному обучению от Яндекса. Они проходят очно в Москве по субботам, раз в две недели. Ведутся онлайн-трансляции, видео загружаются на youtube-канал.

Где применять навыки

Data science и машинное обучение применяются в маркетинге, бизнес-аналитике и других областях. Здесь вы можете увидеть стартапы и их коды на Python.

Автор: Анастасия Колесниченко


Источник: m.vk.com

Комментарии: