So zeichnen sie die verteilung von spaltenwerten in pandas auf
Sie können die folgenden Methoden verwenden, um eine Verteilung von Spaltenwerten in einem Pandas-DataFrame darzustellen:
Methode 1: Zeichnen Sie die Werteverteilung in einer Spalte grafisch auf
df[' my_column ']. plot (kind=' kde ')
Methode 2: Zeichnen Sie die Verteilung der Werte in einer Spalte gruppiert nach einer anderen Spalte auf
df. groupby (' group_column ')[' values_column ']. plot (kind=' kde ')
Die folgenden Beispiele zeigen, wie jede Methode in der Praxis mit dem folgenden Pandas DataFrame verwendet wird:
import pandas as pd #createDataFrame df = pd. DataFrame ({' team ': ['A', 'A', 'A', 'A', 'A', 'A', 'A', 'A', 'A', 'A', 'B', 'B', 'B', 'B', 'B', 'B', 'B', 'B', 'B', 'B'], ' points ': [3, 3, 4, 5, 4, 7, 7, 7, 10, 11, 8, 7, 8, 9, 12, 12, 12, 14, 15, 17]}) #view DataFrame print (df) team points 0 to 3 1 to 3 2 to 4 3 to 5 4 to 4 5 TO 7 6 to 7 7 to 7 8 to 10 9 to 11 10 B 8 11 B 7 12 B 8 13 B 9 14 B 12 15 B 12 16 B 12 17 B 14 18 B 15 19 B 17
Beispiel 1: Stellen Sie die Werteverteilung in einer Spalte grafisch dar
Der folgende Code zeigt, wie die Verteilung der Werte in der Punktespalte dargestellt wird:
#plot distribution of values in points column df[' points ']. plot (kind=' kde ')
Beachten Sie, dass kind=’kde‘ Pandas anweist, die Kernel-Dichteschätzung zu verwenden, die eine glatte Kurve erzeugt, die die Werteverteilung einer Variablen zusammenfasst.
Wenn Sie stattdessen ein Histogramm erstellen möchten, können Sie kind=’hist‘ wie folgt angeben:
#plot distribution of values in points column using histogram df[' points ']. plot (kind=' hist ', edgecolor=' black ')
Bei dieser Methode werden Balken verwendet, um die Häufigkeiten von Werten in der Punktspalte darzustellen, im Gegensatz zu einer glatten Linie, die die Form der Verteilung zusammenfasst.
Beispiel 2: Zeichnen Sie die Verteilung der Werte in einer Spalte gruppiert nach einer anderen Spalte auf
Der folgende Code zeigt, wie die Verteilung der Werte in der Punktespalte , gruppiert nach der Teamspalte , dargestellt wird:
import matplotlib.pyplot as plt #plot distribution of points by team df. groupby (' team ')[' points ']. plot (kind=' kde ') #add legend plt. legend ([' A ',' B '], title=' Team ') #add x-axis label plt. xlabel (' Points ')
Die blaue Linie zeigt die Punkteverteilung der Spieler von Team A, während die orange Linie die Punkteverteilung der Spieler von Team B zeigt.
Zusätzliche Ressourcen
In den folgenden Tutorials wird erläutert, wie Sie andere häufige Aufgaben in Pandas ausführen:
So fügen Sie Titel zu Plots in Pandas hinzu
So passen Sie die Figurengröße eines Panda-Diagramms an
So zeichnen Sie mehrere Pandas DataFrames in Unterplots auf
So erstellen und passen Sie Handlungslegenden in Pandas an