В интернете много лет ходит мем и прикол про разницу в том, что вы ожидаете и что в итоге получаете

МЕНЮ


Искусственный интеллект
Поиск
Регистрация на сайте
Помощь проекту

ТЕМЫ


Новости ИИРазработка ИИВнедрение ИИРабота разума и сознаниеМодель мозгаРобототехника, БПЛАТрансгуманизмОбработка текстаТеория эволюцииДополненная реальностьЖелезоКиберугрозыНаучный мирИТ индустрияРазработка ПОТеория информацииМатематикаЦифровая экономика

Авторизация



RSS


RSS новости


В интернете много лет ходит мем и прикол про разницу в том, что вы ожидаете и что в итоге получаете ? Но что может пойти не так в науке о данных? Сегодня мы собрали для вас основные моменты отличий теории от практики.

Работа на удаленном сервере

Большинство людей начинают свое путешествие в data science на своих компьютерах. Однако в реальном проекте требуемая вычислительная мощность и память намного больше, чем может обеспечить ноутбук. Таким образом, специалисты по обработке данных используют свои компьютеры для доступа к удаленному серверу, обычно используя соединение SSH (Secure Shell), которое позволяет пользователю безопасно получить доступ к другому компьютеру с помощью закрытого ключа (ssh key).

SQL очень важен

Наука о данных и машинное обучение выполняются на Python, Julia и R, верно? Неправильно, это делается на SQL! Каждый проект по науке о данных начинается с данных, и в большинстве случаев данные, которые будут использоваться для решения проблемы, не будут легко доступны, они должны быть созданы с использованием частей данных в нескольких таблицах базы данных. SQL де-факто является стандартным языком баз данных, который используется для быстрого объединения, агрегирования и выбора частей необходимых данных.

MVP

Мир технологий конкурентоспособен и быстро меняется. В большинстве случаев нет времени ждать идеального продукта, который достигнет самых современных характеристик. Вместо того чтобы ориентироваться на идеальный продукт, технологические компании начинают проект и быстро создают MVP (минимально жизнеспособный продукт) и повторяют его. Перфекционисту или человеку, ориентированному на детали (то есть большинству энтузиастов в data science), часто бывает трудно работать над MVP. Большинство специалистов по обработке данных стремятся тщательно анализировать данные, пробуя множество различных функций и моделей и придумывая наилучшую возможную модель.

Agile

Это философия разработки, в которой проекты делятся на небольшие задачи. Каждая задача получает оценочный балл во время планирования спринта, и команда берет общий балл задач для него. На самом деле это легче сказать, чем сделать. Agile разработан для разработки программного обеспечения, где продолжительность задач оценивается более легко, пути и методы хорошо определены. С другой стороны, задачи науки о данных требуют метод проб и ошибок, а продолжительность задач гораздо труднее оценить из-за высокой дисперсии. Есть некоторая ирония в том, что data scientist делает точные прогнозы для других бизнес-задач, но не может сделать то же самое для своих задач.

А отличается ли ваша работы от ожиданий? ?

#it #tech #coding #python #sql #datascience #data #bigdata #наукаоданных #датасайенс

Комментарии: