Come tracciare istogrammi per gruppo in pandas
È possibile utilizzare i seguenti metodi per tracciare istogrammi per gruppo in un DataFrame panda:
Metodo 1: tracciare gli istogrammi per gruppo utilizzando più grafici
df[' values_var ']. hist (by=df[' group_var '])
Metodo 2: tracciare gli istogrammi per gruppo utilizzando un singolo grafico
plt. hist (group1, alpha= 0.5 , label=' group1 ') plt. hist (group2, alpha= 0.5 , label=' group2 ') plt. hist (group3, alpha= 0.5 , label=' group3 ')
I seguenti esempi mostrano come utilizzare ciascun metodo nella pratica con il seguente DataFrame panda che mostra i punti segnati dai giocatori di basket di tre squadre diverse:
import pandas as pd import numpy as np #make this example reproducible n.p. random . seeds (1) #createDataFrame df = pd. DataFrame ({' team ': np.repeat ([' A ',' B ',' C '], 100 ), ' points ': np. random . normal (loc= 20 , scale= 2 , size= 300 )}) #view head of DataFrame print ( df.head ()) team points 0 A 23.248691 1 A 18.776487 2 A 18.943656 3 A 17.854063 4 A 21.730815
Esempio 1: tracciare gli istogrammi per gruppo utilizzando più grafici
Il codice seguente mostra come creare tre istogrammi che mostrano la distribuzione dei punti segnati dai giocatori di ciascuna delle tre squadre:
#create histograms of points by team df[' points ']. hist (by=df[' team '])
Possiamo anche utilizzare l’argomento edgecolor per aggiungere linee di bordo a ciascun istogramma e l’argomento figsize per aumentare la dimensione di ciascun istogramma e renderli più facili da visualizzare:
#create histograms of points by team df[' points ']. hist (by=df[' team '], edgecolor=' black ', figsize = ( 8 , 6 ))
Esempio 2: tracciare gli istogrammi per gruppo utilizzando un singolo grafico
Il codice seguente mostra come creare tre istogrammi e posizionarli tutti sullo stesso grafico:
import matplotlib.pyplot as plt
#define points values by group
A = df. loc [df[' team '] == ' A ', ' points ']
B = df. loc [df[' team '] == ' B ', ' points ']
C = df. loc [df[' team '] == ' C ', ' points ']
#add three histograms to one plot
plt. hist (A, alpha= 0.5 , label=' A ')
plt. hist (B, alpha= 0.5 , label=' B ')
plt. hist (C, alpha= 0.5 , label=' C ')
#add plot title and axis labels
plt. title (' Points Distribution by Team ')
plt. xlabel (' Points ')
plt. ylabel (' Frequency ')
#add legend
plt. legend (title=' Team ')
#displayplot
plt. show ()
Il risultato finale è un grafico che mostra tre istogrammi impilati uno sopra l’altro.
Nota : l’argomento alfa specifica la trasparenza di ciascun istogramma. Questo valore può variare da 0 a 1. Impostando questo valore uguale a 0,5, possiamo visualizzare meglio ciascun istogramma sovrapposto.
Risorse addizionali
I seguenti tutorial spiegano come creare altri grafici comuni in Python:
Come tracciare più linee in Matplotlib
Come creare un boxplot da Pandas DataFrame
Come tracciare più colonne Panda su un grafico a barre