Come tracciare dati categorici in panda (con esempi)


Esistono tre modi comuni per visualizzare i dati categorici :

  • Grafico a barre
  • Box plot per gruppo
  • Trame di mosaico

Gli esempi seguenti mostrano come creare ciascuno di questi grafici per un DataFrame panda in Python.

Esempio 1: grafici a barre

Il codice seguente mostra come creare un grafico a barre per visualizzare la frequenza degli spostamenti in un dato DataFrame panda:

 import pandas as pd

#createDataFrame
df = pd. DataFrame ({' team ': ['A', 'A', 'A', 'B', 'B', 'C', 'C', 'D'],
                   ' points ': [18, 22, 29, 25, 14, 11, 10, 15]})

#create bar plot to visualize frequency of each team
df[' team ']. value_counts (). plot (kind=' bar ', xlabel=' Team ', ylabel=' Count ', rot= 0 )

tracciare dati categorici nei panda

L’asse X mostra il nome di ciascuna squadra e l’asse Y mostra la frequenza di ciascuna squadra nel DataFrame.

Nota : l’argomento rot=0 dice ai panda di ruotare le etichette dell’asse x in modo che siano parallele all’asse x.

Esempio 2: box plot per gruppo

I boxplot raggruppati sono un modo utile per visualizzare una variabile numerica, raggruppata per una variabile categoriale.

Ad esempio, il codice seguente mostra come creare boxplot che mostrano la distribuzione dei punti segnati, raggruppati per squadra:

 import pandas as pd

#createDataFrame
df = pd. DataFrame ({' team ': ['A', 'A', 'A', 'A', 'B', 'B', 'B', 'B'],
                   ' points ': [18, 22, 29, 25, 14, 11, 10, 15]})

#create boxplot of points, grouped by team
df. boxplot (column=[' points '], by=' team ', grid= False , color=' black ')

L’asse x mostra le squadre e l’asse y mostra la distribuzione dei punti segnati da ciascuna squadra.

Esempio 3: trama a mosaico

Un grafico a mosaico è un tipo di grafico che visualizza le frequenze di due diverse variabili categoriali in un unico grafico.

Ad esempio, il codice seguente mostra come creare un grafico a mosaico che mostra la frequenza delle variabili categoriali “risultato” e “team” in un singolo grafico:

 import pandas as pd
from statsmodels. graphics . mosaicplot import mosaic

#createDataFrame
df = pd. DataFrame ({' team ': ['A', 'A', 'A', 'B', 'B', 'B', 'C', 'C', 'C'],
                   ' result ': ['W', 'L', 'L', 'W', 'W', 'L', 'L', 'W', 'W']})

#create mosaic plot
mosaic(df, [' team ', ' result ']); 

diagramma a mosaico per dati categorici nei panda

L’asse x mostra le squadre e l’asse y mostra la frequenza dei risultati per ciascuna squadra.

Risorse addizionali

I seguenti tutorial spiegano come eseguire altre attività comuni nei panda:

Come utilizzare Groupby e Plot in Pandas
Come tracciare la distribuzione dei valori delle colonne in Pandas
Come regolare la dimensione della figura di una trama di panda

Aggiungi un commento

Il tuo indirizzo email non sarà pubblicato. I campi obbligatori sono contrassegnati *