Come modificare il numero di contenitori utilizzati nell'istogramma di panda
Puoi utilizzare l’argomento bins per modificare il numero di bin utilizzati in un istogramma panda:
df. plot . hist (columns=[' my_column '], bins= 10 )
Il numero predefinito di contenitori utilizzati in un istogramma panda è 10.
L’esempio seguente mostra come utilizzare in pratica l’argomento bins .
Esempio: come modificare il numero di contenitori nell’istogramma Panda
Supponiamo di avere il seguente DataFrame panda che contiene informazioni sui punti segnati dai giocatori di basket di diverse squadre:
import pandas as pd import numpy as np #make this example reproducible n.p. random . seeds (1) #createDataFrame df = pd. DataFrame ({' team ': np.repeat ([' A ',' B ',' C '], 100 ), ' points ': np. random . normal (loc= 20 , scale= 2 , size= 300 )}) #view head of DataFrame print ( df.head ()) team points 0 A 23.248691 1 A 18.776487 2 A 18.943656 3 A 17.854063 4 A 21.730815
Se creiamo un istogramma per visualizzare la distribuzione dei valori della variabile punti , i panda utilizzeranno per impostazione predefinita 10 contenitori nell’istogramma:
#create histogram to visualize distribution of points
df. plot . hist (column=[' points '], edgecolor=' black ')
Nota che ci sono 10 barre nell’istogramma.
Supponiamo tuttavia di utilizzare l’argomento bins per modificare il numero totale di bin in 20:
#create histogram with 20 bins
df. plot . hist (column=[' points '], edgecolor=' black ', bins= 20 )
Nota che ora ci sono 20 barre nell’istogramma.
Potremmo anche ridurre il numero di contenitori a 5:
#create histogram with 5 bins
df. plot . hist (column=[' points '], edgecolor=' black ', bins= 5 )
Ora ci sono 5 barre in totale nell’istogramma.
Sentiti libero di regolare il valore dell’argomento bins per creare l’istogramma esatto che desideri.
Tuttavia, quando si sceglie il numero di contenitori, tenere presente i seguenti punti:
- Se si scelgono troppo poche categorie, il vero modello sottostante dei dati può essere nascosto.
- Se scegli troppe categorie, potresti vedere solo rumore nei dati.
Un modo utile per determinare il numero ottimale di contenitori da utilizzare in un istogramma è utilizzare la regola di Sturges .
Risorse addizionali
I seguenti tutorial spiegano come eseguire altre attività comuni nei panda:
Come creare un istogramma da Pandas DataFrame
Come creare un istogramma da una serie di Panda
Come tracciare istogrammi per gruppo in Pandas