So zeichnen sie kategoriale daten in pandas auf (mit beispielen)


Es gibt drei gängige Methoden zur Visualisierung kategorialer Daten :

  • Balkendiagramm
  • Boxplots nach Gruppe
  • Mosaikparzellen

Die folgenden Beispiele zeigen, wie Sie jedes dieser Diagramme für einen Pandas-DataFrame in Python erstellen.

Beispiel 1: Balkendiagramme

Der folgende Code zeigt, wie Sie ein Balkendiagramm erstellen, um die Häufigkeit von Verschiebungen in einem bestimmten Pandas-DataFrame zu visualisieren:

 import pandas as pd

#createDataFrame
df = pd. DataFrame ({' team ': ['A', 'A', 'A', 'B', 'B', 'C', 'C', 'D'],
                   ' points ': [18, 22, 29, 25, 14, 11, 10, 15]})

#create bar plot to visualize frequency of each team
df[' team ']. value_counts (). plot (kind=' bar ', xlabel=' Team ', ylabel=' Count ', rot= 0 )

Zeichnen kategorialer Daten in Pandas

Die X-Achse zeigt den Namen jedes Teams und die Y-Achse zeigt die Häufigkeit jedes Teams im DataFrame.

Hinweis : Das Argument rot=0 weist Pandas an, die Beschriftungen der x-Achse so zu drehen, dass sie parallel zur x-Achse sind.

Beispiel 2: Boxplots nach Gruppe

Cluster-Boxplots sind eine nützliche Methode zur Visualisierung einer numerischen Variablen, gruppiert nach einer kategorialen Variablen.

Der folgende Code zeigt beispielsweise, wie Boxplots erstellt werden, die die Verteilung der erzielten Punkte, gruppiert nach Team, zeigen:

 import pandas as pd

#createDataFrame
df = pd. DataFrame ({' team ': ['A', 'A', 'A', 'A', 'B', 'B', 'B', 'B'],
                   ' points ': [18, 22, 29, 25, 14, 11, 10, 15]})

#create boxplot of points, grouped by team
df. boxplot (column=[' points '], by=' team ', grid= False , color=' black ')

Die x-Achse zeigt die Teams und die y-Achse zeigt die Verteilung der von jedem Team erzielten Punkte.

Beispiel 3: Mosaikplot

Ein gekacheltes Diagramm ist ein Diagrammtyp, der die Häufigkeiten zweier verschiedener kategorialer Variablen in einem einzigen Diagramm anzeigt.

Der folgende Code zeigt beispielsweise, wie ein Mosaikdiagramm erstellt wird, das die Häufigkeit der kategorialen Variablen „Ergebnis“ und „Team“ in einem einzelnen Diagramm zeigt:

 import pandas as pd
from statsmodels. graphics . mosaicplot import mosaic

#createDataFrame
df = pd. DataFrame ({' team ': ['A', 'A', 'A', 'B', 'B', 'B', 'C', 'C', 'C'],
                   ' result ': ['W', 'L', 'L', 'W', 'W', 'L', 'L', 'W', 'W']})

#create mosaic plot
mosaic(df, [' team ', ' result ']); 

Mosaikdiagramm für kategoriale Daten in Pandas

Auf der X-Achse werden die Teams angezeigt und auf der Y-Achse die Häufigkeit der Ergebnisse für jedes Team.

Zusätzliche Ressourcen

In den folgenden Tutorials wird erläutert, wie Sie andere häufige Aufgaben in Pandas ausführen:

So verwenden Sie Groupby und Plot in Pandas
So zeichnen Sie die Verteilung von Spaltenwerten in Pandas auf
So passen Sie die Figurengröße eines Panda-Diagramms an

Einen Kommentar hinzufügen

Deine E-Mail-Adresse wird nicht veröffentlicht. Erforderliche Felder sind mit * markiert