So zeichnen sie die verteilung von spaltenwerten in pandas auf


Sie können die folgenden Methoden verwenden, um eine Verteilung von Spaltenwerten in einem Pandas-DataFrame darzustellen:

Methode 1: Zeichnen Sie die Werteverteilung in einer Spalte grafisch auf

 df[' my_column ']. plot (kind=' kde ')

Methode 2: Zeichnen Sie die Verteilung der Werte in einer Spalte gruppiert nach einer anderen Spalte auf

 df. groupby (' group_column ')[' values_column ']. plot (kind=' kde ')

Die folgenden Beispiele zeigen, wie jede Methode in der Praxis mit dem folgenden Pandas DataFrame verwendet wird:

 import pandas as pd

#createDataFrame
df = pd. DataFrame ({' team ': ['A', 'A', 'A', 'A', 'A', 'A', 'A', 'A', 'A', 'A',
                            'B', 'B', 'B', 'B', 'B', 'B', 'B', 'B', 'B', 'B'],
                   ' points ': [3, 3, 4, 5, 4, 7, 7, 7, 10, 11, 
                              8, 7, 8, 9, 12, 12, 12, 14, 15, 17]})

#view DataFrame
print (df)

   team points
0 to 3
1 to 3
2 to 4
3 to 5
4 to 4
5 TO 7
6 to 7
7 to 7
8 to 10
9 to 11
10 B 8
11 B 7
12 B 8
13 B 9
14 B 12
15 B 12
16 B 12
17 B 14
18 B 15
19 B 17

Beispiel 1: Stellen Sie die Werteverteilung in einer Spalte grafisch dar

Der folgende Code zeigt, wie die Verteilung der Werte in der Punktespalte dargestellt wird:

 #plot distribution of values in points column
df[' points ']. plot (kind=' kde ')

Beachten Sie, dass kind=’kde‘ Pandas anweist, die Kernel-Dichteschätzung zu verwenden, die eine glatte Kurve erzeugt, die die Werteverteilung einer Variablen zusammenfasst.

Wenn Sie stattdessen ein Histogramm erstellen möchten, können Sie kind=’hist‘ wie folgt angeben:

 #plot distribution of values in points column using histogram
df[' points ']. plot (kind=' hist ', edgecolor=' black ') 

Bei dieser Methode werden Balken verwendet, um die Häufigkeiten von Werten in der Punktspalte darzustellen, im Gegensatz zu einer glatten Linie, die die Form der Verteilung zusammenfasst.

Beispiel 2: Zeichnen Sie die Verteilung der Werte in einer Spalte gruppiert nach einer anderen Spalte auf

Der folgende Code zeigt, wie die Verteilung der Werte in der Punktespalte , gruppiert nach der Teamspalte , dargestellt wird:

 import matplotlib.pyplot as plt

#plot distribution of points by team 
df. groupby (' team ')[' points ']. plot (kind=' kde ')

#add legend
plt. legend ([' A ',' B '], title=' Team ')

#add x-axis label
plt. xlabel (' Points ')

Die blaue Linie zeigt die Punkteverteilung der Spieler von Team A, während die orange Linie die Punkteverteilung der Spieler von Team B zeigt.

Zusätzliche Ressourcen

In den folgenden Tutorials wird erläutert, wie Sie andere häufige Aufgaben in Pandas ausführen:

So fügen Sie Titel zu Plots in Pandas hinzu
So passen Sie die Figurengröße eines Panda-Diagramms an
So zeichnen Sie mehrere Pandas DataFrames in Unterplots auf
So erstellen und passen Sie Handlungslegenden in Pandas an

Einen Kommentar hinzufügen

Deine E-Mail-Adresse wird nicht veröffentlicht. Erforderliche Felder sind mit * markiert