Pandas: як використовувати groupby і plot (з прикладами)


Ви можете використовувати такі методи для групування та побудови графіка за допомогою pandas DataFrame:

Спосіб 1. Групуйте та малюйте кілька ліній одним шляхом

 #define index column
df. set_index ('day', inplace= True )

#group data by product and display sales as line chart
df. groupby (' product ')[' sales ']. plot (legend= True )

Спосіб 2: Групуйте та малюйте лінії на окремих ділянках

 p.d. pivot_table ( df.reset_index (),
               index=' day ', columns=' product ', values=' sales '
              ). plot (subplots= True )

У наступному прикладі показано, як використовувати кожен метод на практиці з такими pandas DataFrame:

 import pandas as pd

#createDataFrame
df = pd. DataFrame ({' day ': [1, 2, 3, 4, 5, 1, 2, 3, 4, 5],
                   ' product ': ['A', 'A', 'A', 'A', 'A', 'B', 'B', 'B', 'B', 'B'],
                   ' sales ': [4, 7, 8, 12, 15, 8, 11, 14, 19, 20]})

#view DataFrame
df

	day product sales
0 1 A 4
1 2 To 7
2 3 To 8
3 4 A 12
4 5 To 15
5 1 B 8
6 2 B 11
7 3 B 14
8 4 B 19
9 5 B 20

Спосіб 1. Групуйте та малюйте кілька ліній одним шляхом

У наступному коді показано, як згрупувати DataFrame за змінною “product” і побудувати “продажі” кожного продукту на діаграмі:

 #define index column
df. set_index (' day ', inplace= True )

#group data by product and display sales as line chart
df. groupby (' product ')[' sales ']. plot (legend= True ) 

групування та інтриги панд

На осі х показано день, на осі у – продажі, а в кожному окремому рядку – продажі окремих продуктів.

Спосіб 2: Групуйте та малюйте лінії на окремих ділянках

У наведеному нижче коді показано, як згрупувати DataFrame за змінною «product» і побудувати «продажі» кожного продукту в окремих підсхемах:

 p.d. pivot_table ( df.reset_index (),
               index=' day ', columns=' product ', values=' sales '
              ). plot (subplots= True ) 

панди згруповані та нанесені на підсюжети

Перший графік показує продажі продукту А, а другий графік показує продажі продукту Б.

Зауважте, що ми також можемо використовувати аргумент макета , щоб вказати макет підслідів.

Наприклад, ми можемо вказати, що підділянки будуть у сітці з одним рядком і двома стовпцями:

 p.d. pivot_table ( df.reset_index (),
               index=' day ', columns=' product ', values=' sales '
              ). plot (subplots= True , layout=(1,2)) 

Додаткові ресурси

У наступних посібниках пояснюється, як створити інші типові візуалізації в pandas:

Як створити коробковий графік із Pandas DataFrame
Як створити секторну діаграму з Pandas DataFrame
Як створити гістограму з Pandas DataFrame

Додати коментар

Ваша e-mail адреса не оприлюднюватиметься. Обов’язкові поля позначені *