So berechnen sie quartile in pandas (mit beispiel)


In der Statistik sind Quartile Werte, die einen Datensatz in vier gleiche Teile unterteilen.

Bei der Analyse einer Verteilung interessieren uns im Allgemeinen die folgenden Quartile:

  • Erstes Quartil ( Q1 ): Der Wert am 25. Perzentil
  • Zweites Quartil ( Q2 ): Der Wert am 50. Perzentil
  • Drittes Quartil ( Q3 ): Der Wert am 75. Perzentil

Sie können die folgenden Methoden verwenden, um Quartile von Spalten in einem Pandas-DataFrame zu berechnen:

Methode 1: Quartile für eine Spalte berechnen

 df[' some_column ']. quantile ([ 0.25 , 0.5 , 0.75 ])

Methode 2: Quartile für jede numerische Spalte berechnen

 df. quantile (q=[ 0.25 , 0.5 , 0.75 ], axis= 0 , numeric_only= True )

Die folgenden Beispiele zeigen, wie jede Methode in der Praxis mit dem folgenden Pandas DataFrame verwendet wird:

 import pandas as pd

#createDataFrame
df = pd. DataFrame ({' team ': ['A', 'B', 'C', 'D', 'E', 'F', 'G', 'H', 'I', 'J'],
                   ' points ': [12, 14, 14, 16, 24, 26, 28, 30, 31, 35],
                   ' assists ': [2, 2, 3, 3, 4, 6, 7, 8, 10, 15]})

#view DataFrame
print (df)

  team points assists
0 to 12 2
1 B 14 2
2 C 14 3
3 D 16 3
4 E 24 4
5 F 26 6
6 G 28 7
7:30 8
8 I 31 10
9 D 35 15

Beispiel 1: Quartile für eine Spalte berechnen

Der folgende Code zeigt, wie Quartile nur für die Punktespalte berechnet werden:

 #calculate quartiles for points column
df[' points ']. quantile ([ 0.25 , 0.5 , 0.75 ])

0.25 14.5
0.50 25.0
0.75 29.5
Name: points, dtype: float64

Aus dem Ergebnis können wir sehen:

  • Das erste Quartil beträgt 14,5 .
  • Das zweite Quartil ist 25 .
  • Das dritte Quartil beträgt 29,5 .

Wenn wir nur diese drei Werte kennen, haben wir eine ziemlich gute Vorstellung davon, wie die Werte in der Punktespalte verteilt sind.

Beispiel 2: Quartile für jede numerische Spalte berechnen

Der folgende Code zeigt, wie Quartile für jede numerische Spalte im DataFrame berechnet werden:

 #calculate quartiles for each numeric column in DataFrame
df. quantile (q=[ 0.25 , 0.5 , 0.75 ], axis= 0 , numeric_only= True )

      assist points
0.25 14.5 3.00
0.50 25.0 5.00
0.75 29.5 7.75

Die Ausgabe zeigt die Quartile der beiden numerischen Spalten des DataFrame an.

Beachten Sie, dass es mehrere Möglichkeiten gibt, Quartile einer Verteilung zu berechnen.

Auf der Pandas- Dokumentationsseite finden Sie Informationen zu den verschiedenen Methoden, die die Funktion pandas quantile() zur Berechnung von Quartilen verwendet.

Zusätzliche Ressourcen

In den folgenden Tutorials wird erläutert, wie andere häufige Aufgaben in Pandas ausgeführt werden:

So berechnen Sie die prozentuale Veränderung bei Pandas
So berechnen Sie den kumulativen Prozentsatz bei Pandas
So berechnen Sie den Prozentsatz der Gesamtmenge innerhalb einer Gruppe bei Pandas

Einen Kommentar hinzufügen

Deine E-Mail-Adresse wird nicht veröffentlicht. Erforderliche Felder sind mit * markiert