Come tracciare istogrammi per gruppo in pandas


È possibile utilizzare i seguenti metodi per tracciare istogrammi per gruppo in un DataFrame panda:

Metodo 1: tracciare gli istogrammi per gruppo utilizzando più grafici

 df[' values_var ']. hist (by=df[' group_var '])

Metodo 2: tracciare gli istogrammi per gruppo utilizzando un singolo grafico

 plt. hist (group1, alpha= 0.5 , label=' group1 ')
plt. hist (group2, alpha= 0.5 , label=' group2 ')
plt. hist (group3, alpha= 0.5 , label=' group3 ')

I seguenti esempi mostrano come utilizzare ciascun metodo nella pratica con il seguente DataFrame panda che mostra i punti segnati dai giocatori di basket di tre squadre diverse:

 import pandas as pd
import numpy as np

#make this example reproducible
n.p. random . seeds (1)

#createDataFrame
df = pd. DataFrame ({' team ': np.repeat ([' A ',' B ',' C '], 100 ),
                   ' points ': np. random . normal (loc= 20 , scale= 2 , size= 300 )})

#view head of DataFrame
print ( df.head ())

  team points
0 A 23.248691
1 A 18.776487
2 A 18.943656
3 A 17.854063
4 A 21.730815

Esempio 1: tracciare gli istogrammi per gruppo utilizzando più grafici

Il codice seguente mostra come creare tre istogrammi che mostrano la distribuzione dei punti segnati dai giocatori di ciascuna delle tre squadre:

 #create histograms of points by team
df[' points ']. hist (by=df[' team '])

Possiamo anche utilizzare l’argomento edgecolor per aggiungere linee di bordo a ciascun istogramma e l’argomento figsize per aumentare la dimensione di ciascun istogramma e renderli più facili da visualizzare:

 #create histograms of points by team
df[' points ']. hist (by=df[' team '], edgecolor=' black ', figsize = ( 8 , 6 )) 

Esempio 2: tracciare gli istogrammi per gruppo utilizzando un singolo grafico

Il codice seguente mostra come creare tre istogrammi e posizionarli tutti sullo stesso grafico:

 import matplotlib.pyplot as plt

#define points values by group
A = df. loc [df[' team '] == ' A ', ' points ']
B = df. loc [df[' team '] == ' B ', ' points ']
C = df. loc [df[' team '] == ' C ', ' points ']

#add three histograms to one plot
plt. hist (A, alpha= 0.5 , label=' A ')
plt. hist (B, alpha= 0.5 , label=' B ')
plt. hist (C, alpha= 0.5 , label=' C ')

#add plot title and axis labels
plt. title (' Points Distribution by Team ')
plt. xlabel (' Points ')
plt. ylabel (' Frequency ')

#add legend
plt. legend (title=' Team ')

#displayplot
plt. show ()

Il risultato finale è un grafico che mostra tre istogrammi impilati uno sopra l’altro.

Nota : l’argomento alfa specifica la trasparenza di ciascun istogramma. Questo valore può variare da 0 a 1. Impostando questo valore uguale a 0,5, possiamo visualizzare meglio ciascun istogramma sovrapposto.

Risorse addizionali

I seguenti tutorial spiegano come creare altri grafici comuni in Python:

Come tracciare più linee in Matplotlib
Come creare un boxplot da Pandas DataFrame
Come tracciare più colonne Panda su un grafico a barre

Aggiungi un commento

Il tuo indirizzo email non sarà pubblicato. I campi obbligatori sono contrassegnati *