Как посчитать квартили в пандах (с примером)
В статистике квартили — это значения, делящие набор данных на четыре равные части.
При анализе распределения нас обычно интересуют следующие квартили:
- Первый квартиль ( Q1 ): значение, расположенное в 25-м процентиле.
- Второй квартиль ( Q2 ): значение, расположенное в 50-м процентиле.
- Третий квартиль ( Q3 ): значение, расположенное на 75-м процентиле.
Вы можете использовать следующие методы для расчета квартилей столбцов в DataFrame pandas:
Метод 1: вычисление квартилей для столбца
df[' some_column ']. quantile ([ 0.25 , 0.5 , 0.75 ])
Метод 2: вычисление квартилей для каждого числового столбца
df. quantile (q=[ 0.25 , 0.5 , 0.75 ], axis= 0 , numeric_only= True )
В следующих примерах показано, как использовать каждый метод на практике со следующим DataFrame pandas:
import pandas as pd
#createDataFrame
df = pd. DataFrame ({' team ': ['A', 'B', 'C', 'D', 'E', 'F', 'G', 'H', 'I', 'J'],
' points ': [12, 14, 14, 16, 24, 26, 28, 30, 31, 35],
' assists ': [2, 2, 3, 3, 4, 6, 7, 8, 10, 15]})
#view DataFrame
print (df)
team points assists
0 to 12 2
1 B 14 2
2 C 14 3
3 D 16 3
4 E 24 4
5 F 26 6
6 G 28 7
7:30 8
8 I 31 10
9 D 35 15
Пример 1. Вычисление квартилей для столбца
Следующий код показывает, как вычислить квартили только для столбца точек :
#calculate quartiles for points column
df[' points ']. quantile ([ 0.25 , 0.5 , 0.75 ])
0.25 14.5
0.50 25.0
0.75 29.5
Name: points, dtype: float64
По результату мы видим:
- Первый квартиль равен 14,5 .
- Второй квартиль — 25 .
- Третий квартиль — 29,5 .
Зная только эти три значения, мы имеем довольно хорошее представление о том, как значения распределяются в столбце точек .
Пример 2. Вычисление квартилей для каждого числового столбца
Следующий код показывает, как вычислить квартили для каждого числового столбца в DataFrame:
#calculate quartiles for each numeric column in DataFrame
df. quantile (q=[ 0.25 , 0.5 , 0.75 ], axis= 0 , numeric_only= True )
assist points
0.25 14.5 3.00
0.50 25.0 5.00
0.75 29.5 7.75
В выходных данных отображаются квартили двух числовых столбцов DataFrame.
Обратите внимание, что существует несколько способов расчета квартилей распределения.
Обратитесь к странице документации pandas, чтобы увидеть различные методы, которые функция pandas quantile() использует для расчета квартилей.
Дополнительные ресурсы
В следующих руководствах объясняется, как выполнять другие распространенные задачи в pandas:
Как рассчитать процентное изменение в пандах
Как рассчитать совокупный процент в пандах
Как посчитать процент от суммы внутри группы в пандах