So ändern sie die anzahl der im pandas-histogramm verwendeten bins


Sie können das Argument „bins“ verwenden, um die Anzahl der in einem Pandas-Histogramm verwendeten Bins zu ändern:

 df. plot . hist (columns=[' my_column '], bins= 10 )

Die Standardanzahl der in einem Pandas-Histogramm verwendeten Bins beträgt 10.

Das folgende Beispiel zeigt, wie das Argument bins in der Praxis verwendet wird.

Beispiel: So ändern Sie die Anzahl der Bins im Pandas-Histogramm

Angenommen, wir haben den folgenden Pandas-DataFrame, der Informationen über die von Basketballspielern verschiedener Teams erzielten Punkte enthält:

 import pandas as pd
import numpy as np

#make this example reproducible
n.p. random . seeds (1)

#createDataFrame
df = pd. DataFrame ({' team ': np.repeat ([' A ',' B ',' C '], 100 ),
                   ' points ': np. random . normal (loc= 20 , scale= 2 , size= 300 )})

#view head of DataFrame
print ( df.head ())

  team points
0 A 23.248691
1 A 18.776487
2 A 18.943656
3 A 17.854063
4 A 21.730815

Wenn wir ein Histogramm erstellen, um die Werteverteilung der Punktevariablen zu visualisieren, verwendet Pandas standardmäßig 10 Bins im Histogramm:

 #create histogram to visualize distribution of points
df. plot . hist (column=[' points '], edgecolor=' black ')

Beachten Sie, dass das Histogramm 10 Balken enthält.

Nehmen wir jedoch an, wir verwenden das Argument „bins“ , um die Gesamtzahl der Bins auf 20 zu ändern:

 #create histogram with 20 bins
df. plot . hist (column=[' points '], edgecolor=' black ', bins= 20 ) 

Pandas erhöhen die Anzahl der Bins im Histogramm

Beachten Sie, dass das Histogramm jetzt 20 Balken enthält.

Wir könnten die Anzahl der Behälter auch auf 5 reduzieren:

 #create histogram with 5 bins
df. plot . hist (column=[' points '], edgecolor=' black ', bins= 5 ) 

Pandas verringern die Anzahl der Bins im Histogramm

Das Histogramm enthält jetzt insgesamt 5 Balken.

Sie können den Wert des Arguments „bins“ jederzeit anpassen, um genau das gewünschte Histogramm zu erstellen.

Beachten Sie jedoch bei der Wahl der Anzahl der Behälter folgende Punkte:

  • Wenn Sie zu wenige Kategorien auswählen, kann das wahre zugrunde liegende Muster der Daten verborgen bleiben.
  • Wenn Sie zu viele Kategorien auswählen, sehen Sie möglicherweise nur Rauschen in den Daten.

Eine nützliche Methode zur Bestimmung der optimalen Anzahl von Bins für die Verwendung in einem Histogramm ist die Verwendung der Sturges-Regel .

Zusätzliche Ressourcen

In den folgenden Tutorials wird erläutert, wie Sie andere häufige Aufgaben in Pandas ausführen:

So erstellen Sie ein Histogramm aus Pandas DataFrame
So erstellen Sie ein Histogramm aus einer Pandas-Serie
So zeichnen Sie Histogramme nach Gruppen in Pandas

Einen Kommentar hinzufügen

Deine E-Mail-Adresse wird nicht veröffentlicht. Erforderliche Felder sind mit * markiert