Рубрика: Гид

Numpy: подсчитать количество элементов, превышающих значение

Вы можете использовать следующий базовый синтаксис для подсчета количества элементов, превышающих определенное значение в массиве NumPy: import numpy as np vals_greater_10 = (data > 10 ). sum () Этот конкретный пример вернет количество элементов больше 10 в массиве NumPy с именем...

Pandas: как создать гистограмму для визуализации 10 основных значений

Вы можете использовать следующий базовый синтаксис для создания гистограммы в pandas, которая включает только 10 наиболее часто встречающихся значений в определенном столбце: import pandas as pd import matplotlib. pyplot as plt #find values with top 10 occurrences in 'my_column' top_10 =...

Pandas: как создать кросс-таблицу с процентами

Вы можете использовать аргумент нормализации в функции pandas crosstab() для создания кросс-таблицы, которая отображает процентные значения вместо чисел: p.d. crosstab (df. col1 , df. col2 , normalize=' index ') Аргумент нормализации принимает три разных аргумента: all : Показать процент относительно всех...

Pandas: как использовать aggfunc в функции crosstab()

Вы можете использовать аргумент aggfunc в функции pandas crosstab() для создания кросс-таблицы, которая агрегирует значения с использованием определенной метрики: p.d. crosstab (index=df. col1 , columns=df. col2 , values=df. col3 , aggfunc=' count ') Значением aggfunc по умолчанию является «count», но вы...

Pandas: как создать гистограмму из кросс-таблицы

Вы можете использовать следующие методы для создания гистограммы для визуализации счетчиков в кросс-таблице Pandas: Метод 1: создание кластеризованной гистограммы import matplotlib. pyplot as plt my_crosstab. plot (kind=' bar ') Метод 2. Создайте столбчатую диаграмму с накоплением import matplotlib. pyplot as plt...

Pandas: как сортировать значения в кросс-таблице

Вы можете использовать следующие методы для сортировки строк или столбцов в кросс-таблице Pandas: Способ 1. Сортировка кросс-таблицы по значениям строк p.d. crosstab (df. col1 , df. col2 ). sort_index (axis= 0 , ascending= False ) Способ 2. Сортировка кросс-таблицы по значениям...

Pandas: как использовать переменную в функции query()

Вы можете использовать следующий синтаксис, чтобы использовать функцию query() в pandas и ссылаться на имя переменной: df. query (' team == @team_name ') Этот конкретный запрос ищет строки в DataFrame pandas, где столбец команды равен значению, хранящемуся в переменной с именем...

Pandas: как использовать метод isin() с методом query()

Часто вам может потребоваться использовать функцию isin() в методе query() в pandas для фильтрации строк в DataFrame, где столбец содержит значение в списке. Для этого вы можете использовать следующий синтаксис: df. query (' team in ["A", "B", "D"] ') Этот конкретный...

Pandas: как сгруппировать два столбца и агрегировать

Вы можете использовать следующий базовый синтаксис с функцией groupby() в pandas для группировки по двум столбцам и объединения еще одного столбца: df. groupby ([' var1 ',' var2 '])[' var3 ']. mean () В этом конкретном примере DataFrame группируется по столбцам var1...

Pandas: используйте groupby для расчета среднего значения и не игнорируйте nan.

При использовании функции pandas groupby() для группировки по одному столбцу и вычисления среднего значения другого столбца панды по умолчанию игнорируют значения NaN . Если вместо этого вы хотите отображать NaN , если в столбце присутствуют значения NaN , вы можете использовать...