Сегодня Python — не меньший must have для анализа данных, чем основы статистики или теорвера

2021-10-09 18:00

К сожалению или счастью, времена, когда все аналитики писали на R и больше ничего не знали о программировании, остались далеко позади. Сегодня Python — не меньший must have для анализа данных, чем основы статистики или теорвера.

Для всех начинающих аналитиков и им сочувствующих мы сделали шпаргалку по базовым коллекциям Python. Разберитесь с ними сейчас — и дальше вам будет куда проще понимать сложные «датасайентистские» структуры вроде pandas DataFrame.

Списки a.k.a. «листы»

Список (list) — самый простой Python-контейнер для хранения нескольких значений. Он очень похож на классический динамический массив, последовательно индексированный с нуля. «Фишка» в том, что в списке могут храниться элементы разных типов: например, одновременно числа, строки и даже другие списки.

К элементам списка нужно обращаться по индексу:

pets = [‘Бобик’, ‘Васька’, ‘Жорик’]

print(pets[0]) » ‘Бобик’

Множества

Множество (set) в Python — прямой аналог математического множества, то есть совокупность уникальных неиндексированных объектов. В множестве разные типы данных тоже могут соседствовать, однако элементы должны быть неизменяемы: создать множество списков и множеств не получится, а вот множество строк и чисел — пожалуйста.

Получить прямой доступ к конкретному элементу нельзя. Больше того, они хранятся в произвольном порядке:

pets = {‘Бобик’, ‘Васька’, ‘Жорик’}

print(pets) » {‘Жорик’, ‘Бобик’, ‘Васька’}

P.S. А вот добавить новый объект или удалить элемент с определённым значением можно: само по себе множество изменяемо.

Словари

Словарь Python (dict) — пожалуй, самая важная для будущего датасайентиста «коробочка», больше всего напоминающая серьёзные датафреймы. Представьте себе множество, в которое мы вложили неупорядоченный набор пар «ключ — значение» в духе «Бобик — пёс», «Васька — кот». Если все ключи уникальны и неизменяемы, мы можем использовать их для индексации — то есть обращаться к элементам, хотя коллекция и неупорядочена. Это и есть словарь.

На практике это выглядит так:

pets = {‘Бобик’: ‘пёс’, ‘Васька’: ‘кот’, ‘Жорик’: ‘кот’}

print(pets[‘Жорик’]) » ‘кот’

P.S. Обратите внимание, что сами значения элементов могут дублировать друг друга и изменяться.

Все три коллекции, которые мы разбираем в этом посте, — стандартные встроенные типы данных Python. Другими словами, это всего лишь база, необходимая, чтобы копать глубже :)

Ещё заметим, что мы не затронули неизменяемые контейнеры: строки, кортежи (tuple) и «замороженные» множества (frozenset). Впрочем, если вы всерьёз решили взяться за Python, то без труда справитесь с ними самостоятельно: они очень похожи на своих изменяемых коллег.

Источник: vk.com



		Сегодня Python — не меньший must have для анализа данных, чем основы статистики или теорвера
МЕНЮ Главная страница Поиск Регистрация на сайте Помощь проекту Архив новостей ТЕМЫ Новости ИИ Голосовой помощник Городские сумасшедшие ИИ в медицине ИИ проекты Искусственные нейросети Искусственный интеллект Слежка за людьми Угроза ИИ Разработка ИИ ИИ теория Компьютерные науки Машинное обуч. (Ошибки) Машинное обучение Машинный перевод Нейронные сети начинающим Психология ИИ Реализация ИИ Реализация нейросетей Создание беспилотных авто Трезво про ИИ Философия ИИ Внедрение ИИ Big data Генетические алгоритмы Капсульные нейросети Основы нейронных сетей Распознавание лиц Распознавание образов Распознавание речи Творчество ИИ Техническое зрение Чат-боты Работа разума и сознание Изучение сна Изучение сознания Нейроинтерфейс Психология Работа мозга Работа памяти Работа разума Модель мозга Модель мозга Робототехника, БПЛА Беспилотные автомобили БПЛА Робототехника Трансгуманизм Трансгуманизм Обработка текста Анализ социальных сетей Компьютерная лингвистика Лингвистика Поисковые алгоритмы Теория эволюции Головной мозг Нейронные сети Поведение животных Теория эволюции Дополненная реальность Виртулаьная реальность Дополненная реальность Железо Интернет вещей Квантовый компьютер Нейронные процессоры облачные вычисления Суперкомпьютеры Киберугрозы Кибербезопасность Научный мир Методы исследования Наука и образование Семинары ИТ индустрия ИТ-гиганты Новости ит Разработка ПО Разработка ПО Теория алгоритмов Теория информации Кластеризация Математика Актуальная математика Статистика Теория вероятности Теория информации Теория хаоса Цифровая экономика Технология блокчейн Цифровая экономика Авторизация RSS RSS новости		2021-10-09 18:00 разработка по К сожалению или счастью, времена, когда все аналитики писали на R и больше ничего не знали о программировании, остались далеко позади. Сегодня Python — не меньший must have для анализа данных, чем основы статистики или теорвера. Для всех начинающих аналитиков и им сочувствующих мы сделали шпаргалку по базовым коллекциям Python. Разберитесь с ними сейчас — и дальше вам будет куда проще понимать сложные «датасайентистские» структуры вроде pandas DataFrame. Списки a.k.a. «листы» Список (list) — самый простой Python-контейнер для хранения нескольких значений. Он очень похож на классический динамический массив, последовательно индексированный с нуля. «Фишка» в том, что в списке могут храниться элементы разных типов: например, одновременно числа, строки и даже другие списки. К элементам списка нужно обращаться по индексу: pets = [‘Бобик’, ‘Васька’, ‘Жорик’] print(pets[0]) » ‘Бобик’ Множества Множество (set) в Python — прямой аналог математического множества, то есть совокупность уникальных неиндексированных объектов. В множестве разные типы данных тоже могут соседствовать, однако элементы должны быть неизменяемы: создать множество списков и множеств не получится, а вот множество строк и чисел — пожалуйста. Получить прямой доступ к конкретному элементу нельзя. Больше того, они хранятся в произвольном порядке: pets = {‘Бобик’, ‘Васька’, ‘Жорик’} print(pets) » {‘Жорик’, ‘Бобик’, ‘Васька’} P.S. А вот добавить новый объект или удалить элемент с определённым значением можно: само по себе множество изменяемо. Словари Словарь Python (dict) — пожалуй, самая важная для будущего датасайентиста «коробочка», больше всего напоминающая серьёзные датафреймы. Представьте себе множество, в которое мы вложили неупорядоченный набор пар «ключ — значение» в духе «Бобик — пёс», «Васька — кот». Если все ключи уникальны и неизменяемы, мы можем использовать их для индексации — то есть обращаться к элементам, хотя коллекция и неупорядочена. Это и есть словарь. На практике это выглядит так: pets = {‘Бобик’: ‘пёс’, ‘Васька’: ‘кот’, ‘Жорик’: ‘кот’} print(pets[‘Жорик’]) » ‘кот’ P.S. Обратите внимание, что сами значения элементов могут дублировать друг друга и изменяться. Все три коллекции, которые мы разбираем в этом посте, — стандартные встроенные типы данных Python. Другими словами, это всего лишь база, необходимая, чтобы копать глубже :) Ещё заметим, что мы не затронули неизменяемые контейнеры: строки, кортежи (tuple) и «замороженные» множества (frozenset). Впрочем, если вы всерьёз решили взяться за Python, то без труда справитесь с ними самостоятельно: они очень похожи на своих изменяемых коллег. Источник: vk.com Комментарии:

Сегодня Python — не меньший must have для анализа данных, чем основы статистики или теорвера

Комментарии: