Come modificare il numero di contenitori utilizzati nell'istogramma di panda


Puoi utilizzare l’argomento bins per modificare il numero di bin utilizzati in un istogramma panda:

 df. plot . hist (columns=[' my_column '], bins= 10 )

Il numero predefinito di contenitori utilizzati in un istogramma panda è 10.

L’esempio seguente mostra come utilizzare in pratica l’argomento bins .

Esempio: come modificare il numero di contenitori nell’istogramma Panda

Supponiamo di avere il seguente DataFrame panda che contiene informazioni sui punti segnati dai giocatori di basket di diverse squadre:

 import pandas as pd
import numpy as np

#make this example reproducible
n.p. random . seeds (1)

#createDataFrame
df = pd. DataFrame ({' team ': np.repeat ([' A ',' B ',' C '], 100 ),
                   ' points ': np. random . normal (loc= 20 , scale= 2 , size= 300 )})

#view head of DataFrame
print ( df.head ())

  team points
0 A 23.248691
1 A 18.776487
2 A 18.943656
3 A 17.854063
4 A 21.730815

Se creiamo un istogramma per visualizzare la distribuzione dei valori della variabile punti , i panda utilizzeranno per impostazione predefinita 10 contenitori nell’istogramma:

 #create histogram to visualize distribution of points
df. plot . hist (column=[' points '], edgecolor=' black ')

Nota che ci sono 10 barre nell’istogramma.

Supponiamo tuttavia di utilizzare l’argomento bins per modificare il numero totale di bin in 20:

 #create histogram with 20 bins
df. plot . hist (column=[' points '], edgecolor=' black ', bins= 20 ) 

i panda aumentano il numero di contenitori nell'istogramma

Nota che ora ci sono 20 barre nell’istogramma.

Potremmo anche ridurre il numero di contenitori a 5:

 #create histogram with 5 bins
df. plot . hist (column=[' points '], edgecolor=' black ', bins= 5 ) 

i panda riducono il numero di contenitori nell'istogramma

Ora ci sono 5 barre in totale nell’istogramma.

Sentiti libero di regolare il valore dell’argomento bins per creare l’istogramma esatto che desideri.

Tuttavia, quando si sceglie il numero di contenitori, tenere presente i seguenti punti:

  • Se si scelgono troppo poche categorie, il vero modello sottostante dei dati può essere nascosto.
  • Se scegli troppe categorie, potresti vedere solo rumore nei dati.

Un modo utile per determinare il numero ottimale di contenitori da utilizzare in un istogramma è utilizzare la regola di Sturges .

Risorse addizionali

I seguenti tutorial spiegano come eseguire altre attività comuni nei panda:

Come creare un istogramma da Pandas DataFrame
Come creare un istogramma da una serie di Panda
Come tracciare istogrammi per gruppo in Pandas

Aggiungi un commento

Il tuo indirizzo email non sarà pubblicato. I campi obbligatori sono contrassegnati *