Что нового в Pandas 1.0? |
||
МЕНЮ Искусственный интеллект Поиск Регистрация на сайте Помощь проекту ТЕМЫ Новости ИИ Искусственный интеллект Разработка ИИГолосовой помощник Городские сумасшедшие ИИ в медицине ИИ проекты Искусственные нейросети Слежка за людьми Угроза ИИ ИИ теория Внедрение ИИКомпьютерные науки Машинное обуч. (Ошибки) Машинное обучение Машинный перевод Нейронные сети начинающим Реализация ИИ Реализация нейросетей Создание беспилотных авто Трезво про ИИ Философия ИИ Big data Работа разума и сознаниеМодель мозгаРобототехника, БПЛАТрансгуманизмОбработка текстаТеория эволюцииДополненная реальностьЖелезоКиберугрозыНаучный мирИТ индустрияРазработка ПОТеория информацииМатематикаЦифровая экономика
Генетические алгоритмы Капсульные нейросети Основы нейронных сетей Распознавание лиц Распознавание образов Распознавание речи Техническое зрение Чат-боты Авторизация |
2020-01-24 09:00 Команда разработчиков Pandas недавно опубликовала предварительную версию 1.0. Главное новшество: наконец-то введён заполнитель пропущенных значений общего типа.
Pandas Pandas – популярная библиотека Python для работы с табличными данными, добавляющая к структуре массива NumPy именованные строки и столбцы, а также множество удобных методов. Pandas является одной из важных причин, почему Python стал доминирующим языком программирования в Data Science. Версия 1.0 Так много изменений? На самом деле нет. Метка 1.0 не означает существенных отклонений от 0.25.3, текущей версии от 22 января 2020 года. Релиз 1.0 также не подразумевает, что библиотека вдруг достигла стадии зрелости. Pandas и так устойчиво развивается и годами используется в производственном коде. Уэс МакКинни начал работать над Pandas в ??2008 году. GitHub показывает, что на момент написания публикации модуль используется в 170 000 репозиториев. В дополнение к обычным исправлениям ошибок и незначительной очистке API, pandas 1.0.0 представляет несколько новых особенностей. Основная из них – введение типа данных pd.NA В pandas 0.25 объект DataFrame в зависимости от содержимого столбца может иметь три разных значения для представления отсутствующих данных: Самая большая несуразность относительно пропущенных значений – целочисленный столбец с пропущенным значением автоматически начинает соответствовать типу Такое положение дел связано с тем, что Pandas базируется на библиотеке NumPy. Стремясь улучшить ситуацию, команда разработчиков создала новый класс для представления отсутствующих данных. В документации новой версии это поясняется следующим образом:
Да, мы этого давно ждали. В долгосрочной перспективе общее значение для отсутствующих данных это отлично. Недостаток нового Кроме того, Для получения дополнительной информации см. документацию. Посмотрим, как ведёт себя нововведение с различными типами данных Пропущенные целочисленные Если вы хотите использовать Вот старый способ создать DataFrame с целочисленным столбцом: Результат следующий: Обратите внимание на автоматическое приведение типа к float. Вот новый способ создать столбец, который может обрабатывать Просто указываем Целые числа остались целыми, на месте пропуска новое отображение Столбцы с неизвестными булевыми значениями Аналогично новый dtype введён и для логических значений, чтобы столбцы не приводились к типу object. Вместо стандартного Пропуски в столбце строковых значений Как вы могли догадаться, тот же приём был предложен и для строковых типов, чтобы меньше людей испытывало проблемы с типом Прочие мелочи
Как установить версию? Установка Pandas и Jupyter Lab на Conda: Будьте осторожны ?. Не пытайтесь установить релиз-кандидат в обычной старой среде conda. Скорее всего, вы увидите множество конфликтов пакетов, приводящих к сбою установки. К тому времени, как 1.0.0 будет официально выпущен, мы надеемся, эти конфликты будут устранены. Когда будет официальный релиз 1.0.0? Скоро: 1 февраля 2020 года ? Если вы хотите подождать релиза, вот другие наши публикации о Pandas:
Источники Источник: proglib.io Комментарии: |
|