Pandy: jak korzystać z groupby i plot (z przykładami)


Możesz użyć następujących metod do grupowania i kreślenia za pomocą ramki DataFrame pandy:

Metoda 1: Grupuj według i rysuj wiele linii na jednej ścieżce

 #define index column
df. set_index ('day', inplace= True )

#group data by product and display sales as line chart
df. groupby (' product ')[' sales ']. plot (legend= True )

Metoda 2: Grupuj według i rysuj linie w poszczególnych wykresach cząstkowych

 p.d. pivot_table ( df.reset_index (),
               index=' day ', columns=' product ', values=' sales '
              ). plot (subplots= True )

Poniższy przykład pokazuje, jak w praktyce używać każdej metody z następującą ramką DataFrame pand:

 import pandas as pd

#createDataFrame
df = pd. DataFrame ({' day ': [1, 2, 3, 4, 5, 1, 2, 3, 4, 5],
                   ' product ': ['A', 'A', 'A', 'A', 'A', 'B', 'B', 'B', 'B', 'B'],
                   ' sales ': [4, 7, 8, 12, 15, 8, 11, 14, 19, 20]})

#view DataFrame
df

	day product sales
0 1 A 4
1 2 To 7
2 3 To 8
3 4 A 12
4 5 To 15
5 1 B 8
6 2 B 11
7 3 B 14
8 4 B 19
9 5 B 20

Metoda 1: Grupuj według i rysuj wiele linii na jednej ścieżce

Poniższy kod pokazuje, jak pogrupować ramkę DataFrame według zmiennej „product” i wykreślić „sprzedaż” każdego produktu na wykresie:

 #define index column
df. set_index (' day ', inplace= True )

#group data by product and display sales as line chart
df. groupby (' product ')[' sales ']. plot (legend= True ) 

grupowanie i intryga pand

Oś x pokazuje dzień, oś y pokazuje sprzedaż, a każdy wiersz pokazuje sprzedaż poszczególnych produktów.

Metoda 2: Grupuj według i rysuj linie w poszczególnych wykresach cząstkowych

Poniższy kod pokazuje, jak pogrupować ramkę DataFrame według zmiennej „product” i wykreślić „sprzedaż” każdego produktu w poszczególnych wykresach podrzędnych:

 p.d. pivot_table ( df.reset_index (),
               index=' day ', columns=' product ', values=' sales '
              ). plot (subplots= True ) 

pandy są grupowane i kreślone w poletkach cząstkowych

Pierwszy wykres przedstawia sprzedaż produktu A, drugi wykres przedstawia sprzedaż produktu B.

Zauważ, że możemy również użyć argumentu układu , aby określić układ śladów odejmowanych.

Na przykład możemy określić, że wątki cząstkowe będą w siatce składającej się z jednego wiersza i dwóch kolumn:

 p.d. pivot_table ( df.reset_index (),
               index=' day ', columns=' product ', values=' sales '
              ). plot (subplots= True , layout=(1,2)) 

Dodatkowe zasoby

Poniższe samouczki wyjaśniają, jak tworzyć inne popularne wizualizacje w pandach:

Jak utworzyć wykres pudełkowy z Pandas DataFrame
Jak utworzyć wykres kołowy z Pandas DataFrame
Jak utworzyć histogram z Pandas DataFrame

Dodaj komentarz

Twój adres e-mail nie zostanie opublikowany. Wymagane pola są oznaczone *