Jak obliczyć kwartyle u pand (z przykładem)


W statystyce kwartyle to wartości dzielące zbiór danych na cztery równe części.

Analizując rozkład, generalnie interesują nas następujące kwartyle:

  • Pierwszy kwartyl ( Q1 ): Wartość znajdująca się na 25. percentylu
  • Drugi kwartyl ( Q2 ): Wartość znajdująca się na 50. percentylu
  • Trzeci kwartyl ( Q3 ): Wartość znajdująca się na 75. percentylu

Aby obliczyć kwartyle kolumn w ramce DataFrame pandy, można użyć następujących metod:

Metoda 1: Oblicz kwartyle dla kolumny

 df[' some_column ']. quantile ([ 0.25 , 0.5 , 0.75 ])

Metoda 2: Oblicz kwartyle dla każdej kolumny liczbowej

 df. quantile (q=[ 0.25 , 0.5 , 0.75 ], axis= 0 , numeric_only= True )

Poniższe przykłady pokazują, jak w praktyce używać każdej metody z następującą ramką DataFrame pand:

 import pandas as pd

#createDataFrame
df = pd. DataFrame ({' team ': ['A', 'B', 'C', 'D', 'E', 'F', 'G', 'H', 'I', 'J'],
                   ' points ': [12, 14, 14, 16, 24, 26, 28, 30, 31, 35],
                   ' assists ': [2, 2, 3, 3, 4, 6, 7, 8, 10, 15]})

#view DataFrame
print (df)

  team points assists
0 to 12 2
1 B 14 2
2 C 14 3
3 D 16 3
4 E 24 4
5 F 26 6
6 G 28 7
7:30 8
8 I 31 10
9 D 35 15

Przykład 1: Oblicz kwartyle dla kolumny

Poniższy kod pokazuje, jak obliczyć kwartyle tylko dla kolumny punktów :

 #calculate quartiles for points column
df[' points ']. quantile ([ 0.25 , 0.5 , 0.75 ])

0.25 14.5
0.50 25.0
0.75 29.5
Name: points, dtype: float64

Z wyniku możemy zobaczyć:

  • Pierwszy kwartyl to 14,5 .
  • Drugi kwartyl to 25 .
  • Trzeci kwartyl to 29,5 .

Znając tylko te trzy wartości, mamy całkiem niezłe pojęcie o tym, jak wartości są rozłożone w kolumnie punktów .

Przykład 2: Oblicz kwartyle dla każdej kolumny liczbowej

Poniższy kod pokazuje, jak obliczyć kwartyle dla każdej kolumny liczbowej w ramce DataFrame:

 #calculate quartiles for each numeric column in DataFrame
df. quantile (q=[ 0.25 , 0.5 , 0.75 ], axis= 0 , numeric_only= True )

      assist points
0.25 14.5 3.00
0.50 25.0 5.00
0.75 29.5 7.75

Dane wyjściowe wyświetlają kwartyle dwóch kolumn liczbowych ramki DataFrame.

Należy pamiętać, że istnieje kilka sposobów obliczania kwartylów rozkładu.

Zapoznaj się ze stroną dokumentacji pand, aby zapoznać się z różnymi metodami używanymi przez funkcję panda quantile() do obliczania kwartylów.

Dodatkowe zasoby

Poniższe samouczki wyjaśniają, jak wykonywać inne typowe zadania w pandach:

Jak obliczyć procentową zmianę pand
Jak obliczyć skumulowany procent w pandach
Jak obliczyć procent całości w grupie w pandach

Dodaj komentarz

Twój adres e-mail nie zostanie opublikowany. Wymagane pola są oznaczone *