Сегодня Python — не меньший must have для анализа данных, чем основы статистики или теорвера

МЕНЮ


Главная страница
Поиск
Регистрация на сайте
Помощь проекту
Архив новостей

ТЕМЫ


Новости ИИРазработка ИИВнедрение ИИРабота разума и сознаниеМодель мозгаРобототехника, БПЛАТрансгуманизмОбработка текстаТеория эволюцииДополненная реальностьЖелезоКиберугрозыНаучный мирИТ индустрияРазработка ПОТеория информацииМатематикаЦифровая экономика

Авторизация



RSS


RSS новости


2021-10-09 18:00

разработка по

К сожалению или счастью, времена, когда все аналитики писали на R и больше ничего не знали о программировании, остались далеко позади. Сегодня Python — не меньший must have для анализа данных, чем основы статистики или теорвера.

Для всех начинающих аналитиков и им сочувствующих мы сделали шпаргалку по базовым коллекциям Python. Разберитесь с ними сейчас — и дальше вам будет куда проще понимать сложные «датасайентистские» структуры вроде pandas DataFrame.

Списки a.k.a. «листы»

Список (list) — самый простой Python-контейнер для хранения нескольких значений. Он очень похож на классический динамический массив, последовательно индексированный с нуля. «Фишка» в том, что в списке могут храниться элементы разных типов: например, одновременно числа, строки и даже другие списки.

К элементам списка нужно обращаться по индексу:

pets = [‘Бобик’, ‘Васька’, ‘Жорик’]

print(pets[0]) » ‘Бобик’

Множества

Множество (set) в Python — прямой аналог математического множества, то есть совокупность уникальных неиндексированных объектов. В множестве разные типы данных тоже могут соседствовать, однако элементы должны быть неизменяемы: создать множество списков и множеств не получится, а вот множество строк и чисел — пожалуйста.

Получить прямой доступ к конкретному элементу нельзя. Больше того, они хранятся в произвольном порядке:

pets = {‘Бобик’, ‘Васька’, ‘Жорик’}

print(pets) » {‘Жорик’, ‘Бобик’, ‘Васька’}

P.S. А вот добавить новый объект или удалить элемент с определённым значением можно: само по себе множество изменяемо.

Словари

Словарь Python (dict) — пожалуй, самая важная для будущего датасайентиста «коробочка», больше всего напоминающая серьёзные датафреймы. Представьте себе множество, в которое мы вложили неупорядоченный набор пар «ключ — значение» в духе «Бобик — пёс», «Васька — кот». Если все ключи уникальны и неизменяемы, мы можем использовать их для индексации — то есть обращаться к элементам, хотя коллекция и неупорядочена. Это и есть словарь.

На практике это выглядит так:

pets = {‘Бобик’: ‘пёс’, ‘Васька’: ‘кот’, ‘Жорик’: ‘кот’}

print(pets[‘Жорик’]) » ‘кот’

P.S. Обратите внимание, что сами значения элементов могут дублировать друг друга и изменяться.

Все три коллекции, которые мы разбираем в этом посте, — стандартные встроенные типы данных Python. Другими словами, это всего лишь база, необходимая, чтобы копать глубже :)

Ещё заметим, что мы не затронули неизменяемые контейнеры: строки, кортежи (tuple) и «замороженные» множества (frozenset). Впрочем, если вы всерьёз решили взяться за Python, то без труда справитесь с ними самостоятельно: они очень похожи на своих изменяемых коллег.


Источник: vk.com

Комментарии: