Сегодня Python — не меньший must have для анализа данных, чем основы статистики или теорвера |
||
МЕНЮ Главная страница Поиск Регистрация на сайте Помощь проекту Архив новостей ТЕМЫ Новости ИИ Голосовой помощник Разработка ИИГородские сумасшедшие ИИ в медицине ИИ проекты Искусственные нейросети Искусственный интеллект Слежка за людьми Угроза ИИ ИИ теория Внедрение ИИКомпьютерные науки Машинное обуч. (Ошибки) Машинное обучение Машинный перевод Нейронные сети начинающим Психология ИИ Реализация ИИ Реализация нейросетей Создание беспилотных авто Трезво про ИИ Философия ИИ Big data Работа разума и сознаниеМодель мозгаРобототехника, БПЛАТрансгуманизмОбработка текстаТеория эволюцииДополненная реальностьЖелезоКиберугрозыНаучный мирИТ индустрияРазработка ПОТеория информацииМатематикаЦифровая экономика
Генетические алгоритмы Капсульные нейросети Основы нейронных сетей Распознавание лиц Распознавание образов Распознавание речи Творчество ИИ Техническое зрение Чат-боты Авторизация |
2021-10-09 18:00 К сожалению или счастью, времена, когда все аналитики писали на R и больше ничего не знали о программировании, остались далеко позади. Сегодня Python — не меньший must have для анализа данных, чем основы статистики или теорвера. Для всех начинающих аналитиков и им сочувствующих мы сделали шпаргалку по базовым коллекциям Python. Разберитесь с ними сейчас — и дальше вам будет куда проще понимать сложные «датасайентистские» структуры вроде pandas DataFrame. Списки a.k.a. «листы» Список (list) — самый простой Python-контейнер для хранения нескольких значений. Он очень похож на классический динамический массив, последовательно индексированный с нуля. «Фишка» в том, что в списке могут храниться элементы разных типов: например, одновременно числа, строки и даже другие списки. К элементам списка нужно обращаться по индексу: pets = [‘Бобик’, ‘Васька’, ‘Жорик’] print(pets[0]) » ‘Бобик’ Множества Множество (set) в Python — прямой аналог математического множества, то есть совокупность уникальных неиндексированных объектов. В множестве разные типы данных тоже могут соседствовать, однако элементы должны быть неизменяемы: создать множество списков и множеств не получится, а вот множество строк и чисел — пожалуйста. Получить прямой доступ к конкретному элементу нельзя. Больше того, они хранятся в произвольном порядке: pets = {‘Бобик’, ‘Васька’, ‘Жорик’} print(pets) » {‘Жорик’, ‘Бобик’, ‘Васька’} P.S. А вот добавить новый объект или удалить элемент с определённым значением можно: само по себе множество изменяемо. Словари Словарь Python (dict) — пожалуй, самая важная для будущего датасайентиста «коробочка», больше всего напоминающая серьёзные датафреймы. Представьте себе множество, в которое мы вложили неупорядоченный набор пар «ключ — значение» в духе «Бобик — пёс», «Васька — кот». Если все ключи уникальны и неизменяемы, мы можем использовать их для индексации — то есть обращаться к элементам, хотя коллекция и неупорядочена. Это и есть словарь. На практике это выглядит так: pets = {‘Бобик’: ‘пёс’, ‘Васька’: ‘кот’, ‘Жорик’: ‘кот’} print(pets[‘Жорик’]) » ‘кот’ P.S. Обратите внимание, что сами значения элементов могут дублировать друг друга и изменяться. Все три коллекции, которые мы разбираем в этом посте, — стандартные встроенные типы данных Python. Другими словами, это всего лишь база, необходимая, чтобы копать глубже :) Ещё заметим, что мы не затронули неизменяемые контейнеры: строки, кортежи (tuple) и «замороженные» множества (frozenset). Впрочем, если вы всерьёз решили взяться за Python, то без труда справитесь с ними самостоятельно: они очень похожи на своих изменяемых коллег. Источник: vk.com Комментарии: |
|