Как посчитать квартили в пандах (с примером)


В статистике квартили — это значения, делящие набор данных на четыре равные части.

При анализе распределения нас обычно интересуют следующие квартили:

  • Первый квартиль ( Q1 ): значение, расположенное в 25-м процентиле.
  • Второй квартиль ( Q2 ): значение, расположенное в 50-м процентиле.
  • Третий квартиль ( Q3 ): значение, расположенное на 75-м процентиле.

Вы можете использовать следующие методы для расчета квартилей столбцов в DataFrame pandas:

Метод 1: вычисление квартилей для столбца

 df[' some_column ']. quantile ([ 0.25 , 0.5 , 0.75 ])

Метод 2: вычисление квартилей для каждого числового столбца

 df. quantile (q=[ 0.25 , 0.5 , 0.75 ], axis= 0 , numeric_only= True )

В следующих примерах показано, как использовать каждый метод на практике со следующим DataFrame pandas:

 import pandas as pd

#createDataFrame
df = pd. DataFrame ({' team ': ['A', 'B', 'C', 'D', 'E', 'F', 'G', 'H', 'I', 'J'],
                   ' points ': [12, 14, 14, 16, 24, 26, 28, 30, 31, 35],
                   ' assists ': [2, 2, 3, 3, 4, 6, 7, 8, 10, 15]})

#view DataFrame
print (df)

  team points assists
0 to 12 2
1 B 14 2
2 C 14 3
3 D 16 3
4 E 24 4
5 F 26 6
6 G 28 7
7:30 8
8 I 31 10
9 D 35 15

Пример 1. Вычисление квартилей для столбца

Следующий код показывает, как вычислить квартили только для столбца точек :

 #calculate quartiles for points column
df[' points ']. quantile ([ 0.25 , 0.5 , 0.75 ])

0.25 14.5
0.50 25.0
0.75 29.5
Name: points, dtype: float64

По результату мы видим:

  • Первый квартиль равен 14,5 .
  • Второй квартиль — 25 .
  • Третий квартиль — 29,5 .

Зная только эти три значения, мы имеем довольно хорошее представление о том, как значения распределяются в столбце точек .

Пример 2. Вычисление квартилей для каждого числового столбца

Следующий код показывает, как вычислить квартили для каждого числового столбца в DataFrame:

 #calculate quartiles for each numeric column in DataFrame
df. quantile (q=[ 0.25 , 0.5 , 0.75 ], axis= 0 , numeric_only= True )

      assist points
0.25 14.5 3.00
0.50 25.0 5.00
0.75 29.5 7.75

В выходных данных отображаются квартили двух числовых столбцов DataFrame.

Обратите внимание, что существует несколько способов расчета квартилей распределения.

Обратитесь к странице документации pandas, чтобы увидеть различные методы, которые функция pandas quantile() использует для расчета квартилей.

Дополнительные ресурсы

В следующих руководствах объясняется, как выполнять другие распространенные задачи в pandas:

Как рассчитать процентное изменение в пандах
Как рассчитать совокупный процент в пандах
Как посчитать процент от суммы внутри группы в пандах

Добавить комментарий

Ваш адрес email не будет опубликован. Обязательные поля помечены *