Jak wykreślić dane kategoryczne w pandach (z przykładami)
Istnieją trzy popularne sposoby wizualizacji danych kategorycznych :
- Wykres słupkowy
- Wykresy pudełkowe według grup
- Działki mozaikowe
Poniższe przykłady pokazują, jak utworzyć każdy z tych wykresów dla ramki danych pand w języku Python.
Przykład 1: Wykresy słupkowe
Poniższy kod pokazuje, jak utworzyć wykres słupkowy wizualizujący częstotliwość przesunięć w danej ramce DataFrame pandy:
import pandas as pd
#createDataFrame
df = pd. DataFrame ({' team ': ['A', 'A', 'A', 'B', 'B', 'C', 'C', 'D'],
' points ': [18, 22, 29, 25, 14, 11, 10, 15]})
#create bar plot to visualize frequency of each team
df[' team ']. value_counts (). plot (kind=' bar ', xlabel=' Team ', ylabel=' Count ', rot= 0 )
Oś X pokazuje nazwę każdego zespołu, a oś Y pokazuje częstotliwość występowania każdego zespołu w DataFrame.
Uwaga : Argument rot=0 mówi pandom, aby obróciły etykiety osi X tak, aby były równoległe do osi X.
Przykład 2: Wykresy pudełkowe według grup
Skupione wykresy pudełkowe są użytecznym sposobem wizualizacji zmiennej numerycznej pogrupowanej według zmiennej jakościowej.
Na przykład poniższy kod pokazuje, jak utworzyć wykresy pudełkowe pokazujące rozkład zdobytych punktów, pogrupowane według drużyn:
import pandas as pd
#createDataFrame
df = pd. DataFrame ({' team ': ['A', 'A', 'A', 'A', 'B', 'B', 'B', 'B'],
' points ': [18, 22, 29, 25, 14, 11, 10, 15]})
#create boxplot of points, grouped by team
df. boxplot (column=[' points '], by=' team ', grid= False , color=' black ')
Oś x przedstawia drużyny, oś y przedstawia rozkład punktów zdobytych przez każdą drużynę.
Przykład 3: wykres mozaikowy
Wykres kafelkowy to rodzaj wykresu przedstawiający częstości występowania dwóch różnych zmiennych kategorycznych na jednym wykresie.
Na przykład poniższy kod pokazuje, jak utworzyć wykres mozaikowy przedstawiający częstotliwość występowania zmiennych kategorialnych „wynik” i „zespół” na jednym wykresie:
import pandas as pd
from statsmodels. graphics . mosaicplot import mosaic
#createDataFrame
df = pd. DataFrame ({' team ': ['A', 'A', 'A', 'B', 'B', 'B', 'C', 'C', 'C'],
' result ': ['W', 'L', 'L', 'W', 'W', 'L', 'L', 'W', 'W']})
#create mosaic plot
mosaic(df, [' team ', ' result ']);
Oś x przedstawia zespoły, a oś y przedstawia częstotliwość wyników dla każdego zespołu.
Dodatkowe zasoby
Poniższe samouczki wyjaśniają, jak wykonywać inne typowe zadania w pandach:
Jak korzystać z Groupby i Plot w Pandach
Jak wykreślić rozkład wartości kolumn w Pandach
Jak dostosować rozmiar figury na wykresie pandy