Hoe kwartielen in panda's te berekenen (met voorbeeld)


In de statistieken zijn kwartielen waarden die een reeks gegevens in vier gelijke delen verdelen.

Bij het analyseren van een verdeling zijn we doorgaans geïnteresseerd in de volgende kwartielen:

  • Eerste kwartiel ( Q1 ): De waarde op het 25e percentiel
  • Tweede kwartiel ( Q2 ): De waarde op het 50e percentiel
  • Derde kwartiel ( Q3 ): De waarde op het 75e percentiel

U kunt de volgende methoden gebruiken om kwartielen van kolommen in een pandas DataFrame te berekenen:

Methode 1: Bereken kwartielen voor een kolom

 df[' some_column ']. quantile ([ 0.25 , 0.5 , 0.75 ])

Methode 2: Bereken kwartielen voor elke numerieke kolom

 df. quantile (q=[ 0.25 , 0.5 , 0.75 ], axis= 0 , numeric_only= True )

De volgende voorbeelden laten zien hoe u elke methode in de praktijk kunt gebruiken met de volgende panda’s DataFrame:

 import pandas as pd

#createDataFrame
df = pd. DataFrame ({' team ': ['A', 'B', 'C', 'D', 'E', 'F', 'G', 'H', 'I', 'J'],
                   ' points ': [12, 14, 14, 16, 24, 26, 28, 30, 31, 35],
                   ' assists ': [2, 2, 3, 3, 4, 6, 7, 8, 10, 15]})

#view DataFrame
print (df)

  team points assists
0 to 12 2
1 B 14 2
2 C 14 3
3 D 16 3
4 E 24 4
5 F 26 6
6 G 28 7
7:30 8
8 I 31 10
9 D 35 15

Voorbeeld 1: Bereken kwartielen voor een kolom

De volgende code laat zien hoe u kwartielen alleen voor de puntenkolom kunt berekenen:

 #calculate quartiles for points column
df[' points ']. quantile ([ 0.25 , 0.5 , 0.75 ])

0.25 14.5
0.50 25.0
0.75 29.5
Name: points, dtype: float64

Uit het resultaat kunnen we zien:

  • Het eerste kwartiel is 14,5 .
  • Het tweede kwartiel is 25 .
  • Het derde kwartiel is 29,5 .

Door alleen deze drie waarden te kennen, hebben we een redelijk goed beeld van hoe de waarden verdeeld zijn in de puntenkolom .

Voorbeeld 2: Bereken kwartielen voor elke numerieke kolom

De volgende code laat zien hoe u kwartielen voor elke numerieke kolom in het DataFrame berekent:

 #calculate quartiles for each numeric column in DataFrame
df. quantile (q=[ 0.25 , 0.5 , 0.75 ], axis= 0 , numeric_only= True )

      assist points
0.25 14.5 3.00
0.50 25.0 5.00
0.75 29.5 7.75

De uitvoer toont de kwartielen van de twee numerieke kolommen van het DataFrame.

Merk op dat er verschillende manieren zijn om kwartielen van een verdeling te berekenen.

Raadpleeg de pandas- documentatiepagina om de verschillende methoden te bekijken die de pandas quantile()- functie gebruikt om kwartielen te berekenen.

Aanvullende bronnen

In de volgende tutorials wordt uitgelegd hoe u andere veelvoorkomende taken in panda’s kunt uitvoeren:

Hoe de procentuele verandering bij panda’s te berekenen
Hoe het cumulatieve percentage in panda’s te berekenen
Hoe het percentage van het totaal binnen een groep bij panda’s te berekenen

Einen Kommentar hinzufügen

Deine E-Mail-Adresse wird nicht veröffentlicht. Erforderliche Felder sind mit * markiert