Pandy: jak korzystać z groupby i plot (z przykładami)
Możesz użyć następujących metod do grupowania i kreślenia za pomocą ramki DataFrame pandy:
Metoda 1: Grupuj według i rysuj wiele linii na jednej ścieżce
#define index column df. set_index ('day', inplace= True ) #group data by product and display sales as line chart df. groupby (' product ')[' sales ']. plot (legend= True )
Metoda 2: Grupuj według i rysuj linie w poszczególnych wykresach cząstkowych
p.d. pivot_table ( df.reset_index (), index=' day ', columns=' product ', values=' sales ' ). plot (subplots= True )
Poniższy przykład pokazuje, jak w praktyce używać każdej metody z następującą ramką DataFrame pand:
import pandas as pd #createDataFrame df = pd. DataFrame ({' day ': [1, 2, 3, 4, 5, 1, 2, 3, 4, 5], ' product ': ['A', 'A', 'A', 'A', 'A', 'B', 'B', 'B', 'B', 'B'], ' sales ': [4, 7, 8, 12, 15, 8, 11, 14, 19, 20]}) #view DataFrame df day product sales 0 1 A 4 1 2 To 7 2 3 To 8 3 4 A 12 4 5 To 15 5 1 B 8 6 2 B 11 7 3 B 14 8 4 B 19 9 5 B 20
Metoda 1: Grupuj według i rysuj wiele linii na jednej ścieżce
Poniższy kod pokazuje, jak pogrupować ramkę DataFrame według zmiennej „product” i wykreślić „sprzedaż” każdego produktu na wykresie:
#define index column df. set_index (' day ', inplace= True ) #group data by product and display sales as line chart df. groupby (' product ')[' sales ']. plot (legend= True )
Oś x pokazuje dzień, oś y pokazuje sprzedaż, a każdy wiersz pokazuje sprzedaż poszczególnych produktów.
Metoda 2: Grupuj według i rysuj linie w poszczególnych wykresach cząstkowych
Poniższy kod pokazuje, jak pogrupować ramkę DataFrame według zmiennej „product” i wykreślić „sprzedaż” każdego produktu w poszczególnych wykresach podrzędnych:
p.d. pivot_table ( df.reset_index (), index=' day ', columns=' product ', values=' sales ' ). plot (subplots= True )
Pierwszy wykres przedstawia sprzedaż produktu A, drugi wykres przedstawia sprzedaż produktu B.
Zauważ, że możemy również użyć argumentu układu , aby określić układ śladów odejmowanych.
Na przykład możemy określić, że wątki cząstkowe będą w siatce składającej się z jednego wiersza i dwóch kolumn:
p.d. pivot_table ( df.reset_index (), index=' day ', columns=' product ', values=' sales ' ). plot (subplots= True , layout=(1,2))
Dodatkowe zasoby
Poniższe samouczki wyjaśniają, jak tworzyć inne popularne wizualizacje w pandach:
Jak utworzyć wykres pudełkowy z Pandas DataFrame
Jak utworzyć wykres kołowy z Pandas DataFrame
Jak utworzyć histogram z Pandas DataFrame