Data science: какие технологии в тренде 2020

МЕНЮ


Искусственный интеллект
Поиск
Регистрация на сайте
Помощь проекту

ТЕМЫ


Новости ИИРазработка ИИВнедрение ИИРабота разума и сознаниеМодель мозгаРобототехника, БПЛАТрансгуманизмОбработка текстаТеория эволюцииДополненная реальностьЖелезоКиберугрозыНаучный мирИТ индустрияРазработка ПОТеория информацииМатематикаЦифровая экономика

Авторизация



RSS


RSS новости


2020-04-03 01:38

новости ит

Технологии data science меняются, но не так быстро, как многие думают. ВЫ удивитесь, но в этом мире по-прежнему правит Python.

Профессия специалиста по анализу данных становится все более востребованной. При этом, как ни странно, набор навыков, которыми должны обладать соискатели рабочих мест, остается более-менее-постоянным. И на первом месте здесь, как и в глубоком для data science прошлом, остается владением питоном.

Обозреватель интернет-ресурса Medium Джефф Хейл проанализировал вакансии в области data science и смежных областях начиная с октября 2018 года. Он анализировал Indeed, SimplyHired, Monster и AngelList. Если посмотреть на списки самых популярных технологий, которые упоминаются как в резюме, так и в объявлениях о вакансиях, и сравнить данные за 2018 и 2019 годы, можно обнаружить, эти перечни окажутся практически идентичными. Python был и намерен оставаться доминирующим языком программирования для аналитиков данных.

Тем не менее, какие-то изменения, безусловно, имеются. R (язык программирования для статистической обработки данных) в прошло году сильно сдал позиции. Библиотека машинного обучения для Python - PyTorch стремительными темпами набирает популярность. А более традиционные SAS and Matlab ее, наоборот, теряют.

Если вы не еще не знакомы с PyTorch, в ближайшее время ваша встреча непременно произойдет. Когда речь заходит об интегрированной системе, люди первым делом часто вспоминают о TensorFlow - разработанной Google открытая программной библиотеке для машинного обучения. Но PyTorch (детище Facebook) обязано своей популярностью одному очень важному качеству: гибкости. Главное отличие между ними заключается в подходе к вычислительному графу - абстракции, описывающей вычисления в системе в виде графа. Излишне уточнять, что речь идет не о дворянском титуле, а о совокупность объектов со связями между ними. У Tensorflow граф статический, у PyTorch – динамический. Что это дает пользователю? Если не вдаваться в дебри – минус одну ступень в работе над данными, а значит – повышение скорости и эффективности.

Помимо этого, PyTorch более прост в овладении. Однако как более новая технология по сравнении с TensorFlow, он уступает последнему в том, что касается сообщества и других источников.

Открытые источники рулят в data science. Есть, конечно, несколько отважных частных программ, но не им сегодня принадлежит мир данных. Они могут подниматься или опускаться в рейтинге, но ресурсы, находящиеся в отрытом доступе, неуклонно продолжают свое восхождение.

Что делать тому, кто только приступает к изучению data science? Не торопиться. Начинать осваивать необходимые инструменты - последовательно, шаг за шагом.

Эксперты советуют делать это в следующем порядке:

Python – для программирования в целом;

Pandas – для манипуляция с данными;

Библиотека Scikit-learn library - для знакомства с машинным обучением;

SQL – для составления запросов;

Tableau - для визуализации данных;

Облачная платформа – для использования моделей и приложений;

TensorFlow или PyTorch – для глубокого обучение.

К счастью, большинство этих инструментов находятся в открытом доступе или стоят совсем недорого.

Автор: Ген Директора


Источник: m.vk.com

Комментарии: