В интернете много лет ходит мем и прикол про разницу в том, что вы ожидаете и что в итоге получаете |
||
МЕНЮ Искусственный интеллект Поиск Регистрация на сайте Помощь проекту ТЕМЫ Новости ИИ Искусственный интеллект Разработка ИИГолосовой помощник Городские сумасшедшие ИИ в медицине ИИ проекты Искусственные нейросети Слежка за людьми Угроза ИИ ИИ теория Внедрение ИИКомпьютерные науки Машинное обуч. (Ошибки) Машинное обучение Машинный перевод Нейронные сети начинающим Реализация ИИ Реализация нейросетей Создание беспилотных авто Трезво про ИИ Философия ИИ Big data Работа разума и сознаниеМодель мозгаРобототехника, БПЛАТрансгуманизмОбработка текстаТеория эволюцииДополненная реальностьЖелезоКиберугрозыНаучный мирИТ индустрияРазработка ПОТеория информацииМатематикаЦифровая экономика
Генетические алгоритмы Капсульные нейросети Основы нейронных сетей Распознавание лиц Распознавание образов Распознавание речи Техническое зрение Чат-боты Авторизация |
2020-10-19 19:08 В интернете много лет ходит мем и прикол про разницу в том, что вы ожидаете и что в итоге получаете ? Но что может пойти не так в науке о данных? Сегодня мы собрали для вас основные моменты отличий теории от практики. Работа на удаленном сервереБольшинство людей начинают свое путешествие в data science на своих компьютерах. Однако в реальном проекте требуемая вычислительная мощность и память намного больше, чем может обеспечить ноутбук. Таким образом, специалисты по обработке данных используют свои компьютеры для доступа к удаленному серверу, обычно используя соединение SSH (Secure Shell), которое позволяет пользователю безопасно получить доступ к другому компьютеру с помощью закрытого ключа (ssh key). SQL очень важенНаука о данных и машинное обучение выполняются на Python, Julia и R, верно? Неправильно, это делается на SQL! Каждый проект по науке о данных начинается с данных, и в большинстве случаев данные, которые будут использоваться для решения проблемы, не будут легко доступны, они должны быть созданы с использованием частей данных в нескольких таблицах базы данных. SQL де-факто является стандартным языком баз данных, который используется для быстрого объединения, агрегирования и выбора частей необходимых данных. MVPМир технологий конкурентоспособен и быстро меняется. В большинстве случаев нет времени ждать идеального продукта, который достигнет самых современных характеристик. Вместо того чтобы ориентироваться на идеальный продукт, технологические компании начинают проект и быстро создают MVP (минимально жизнеспособный продукт) и повторяют его. Перфекционисту или человеку, ориентированному на детали (то есть большинству энтузиастов в data science), часто бывает трудно работать над MVP. Большинство специалистов по обработке данных стремятся тщательно анализировать данные, пробуя множество различных функций и моделей и придумывая наилучшую возможную модель. AgileЭто философия разработки, в которой проекты делятся на небольшие задачи. Каждая задача получает оценочный балл во время планирования спринта, и команда берет общий балл задач для него. На самом деле это легче сказать, чем сделать. Agile разработан для разработки программного обеспечения, где продолжительность задач оценивается более легко, пути и методы хорошо определены. С другой стороны, задачи науки о данных требуют метод проб и ошибок, а продолжительность задач гораздо труднее оценить из-за высокой дисперсии. Есть некоторая ирония в том, что data scientist делает точные прогнозы для других бизнес-задач, но не может сделать то же самое для своих задач. А отличается ли ваша работы от ожиданий? ? #it #tech #coding #python #sql #datascience #data #bigdata #наукаоданных #датасайенс Комментарии: |
|