Як побудувати два стовпці з pandas dataframe
Існує два поширених способи побудови значень двох стовпців у pandas DataFrame:
Спосіб 1. Побудуйте два стовпці як точки на діаграмі розсіювання
import matplotlib. pyplot as plt
plt. scatter (df[' column1 '], df[' column2 '])
Спосіб 2. Побудуйте два стовпці у вигляді ліній на лінійному графіку
df. plot (x=' column1 ',y=[' column2 ',' column3 '])
Наступні приклади показують, як використовувати кожен метод на практиці.
Приклад 1: побудуйте два стовпці на точковій діаграмі
Припустімо, що у нас є такий фрейм даних pandas, який містить інформацію про різних баскетболістів:
import pandas as pd
#createDataFrame
df = pd. DataFrame ({' team ': ['A', 'B', 'C', 'D', 'E', 'F', 'G', 'H'],
' points ': [18, 22, 19, 14, 14, 11, 20, 28],
' assists ': [5, 7, 7, 9, 12, 9, 9, 4]})
#view DataFrame
print (df)
team points assists
0 to 18 5
1 B 22 7
2 C 19 7
3 D 14 9
4 E 14 12
5 F 11 9
6 G 20 9
7:28 a.m. 4
Ми можемо використати наступний код, щоб створити діаграму розсіювання, яка відображає стовпець точок на осі X і стовпець допоміжних балів на осі Y:
import matplotlib. pyplot as plt
#create scatterplot
plt. scatter (df[' points '], df[' assists '])
#add axis labels
plt. xlabel (' Points ')
plt. ylabel (' Assists ')
Вісь X містить значення зі стовпця очок , а вісь Y містить значення зі стовпця передач .
Приклад 2: побудуйте два стовпці на лінійному графіку
Припустімо, що ми маємо такий фрейм даних pandas, який містить інформацію про набрані очки та дозволені очки баскетбольної команди в шести різних іграх:
import pandas as pd
#createDataFrame
df = pd. DataFrame ({' game ': [1, 2, 3, 4, 5, 6],
' points_for ': [99, 94, 92, 90, 87, 85],
' points_against ': [89, 76, 78, 78, 85, 87]})
#view DataFrame
print (df)
game points_for points_against
0 1 99 89
1 2 94 76
2 3 92 78
3 4 90 78
4 5 87 85
5 6 85 87
Ми можемо використати наступний код, щоб створити лінійну діаграму, яка відображає значення point_for в одному рядку та points_against в іншому рядку, використовуючи значення game на осі x:
#plot points_for and points_against columns on same y-axis
df. plot (x=' game ', y=[' points_for ', ' points_against '])
Синя лінія представляє значення стовпця points_for у кожній грі, а помаранчева лінія представляє значення стовпця points_against у кожній грі.
Додаткові ресурси
У наступних посібниках пояснюється, як виконувати інші типові завдання в pandas:
Як використовувати Groupby та Plot у Pandas
Як побудувати графік розподілу значень стовпців у Pandas
Як скоригувати розмір фігури панди сюжет