Как создать облако точек из dataframe pandas
Существует два способа создания облака точек с использованием данных из DataFrame pandas:
1. Используйте pandas.DataFrame.plot.scatter.
Один из способов создания диаграммы рассеяния — использовать встроенную функцию Pandasplot.scatter() :
import pandas as pd df. plot . scatter (x = ' x_column_name ', y = ' y_columnn_name ')
2. Используйте matplotlib.pyplot.scatter.
Другой способ создать диаграмму рассеяния — использовать функцию Matplotlib pyplot.scatter() :
import matplotlib. pyplot as plt plt. scatter (df.x, df.y)
В этом руководстве представлен пример использования каждого из этих методов.
Пример 1: использование панд
Следующий код показывает, как использовать функциюplot.scatter() для создания простой диаграммы рассеяния:
import pandas as pd #createDataFrame df = pd. DataFrame ({'x': [1, 3, 3, 4, 5, 7, 9, 12, 13, 15], 'y': [5, 7, 9, 7, 6, 12, 14, 18, 15, 22]}) #create scatterplot df. plot . scatter (x=' x ', y=' y ')
Обратите внимание, что вы можете использовать аргументы s и c для изменения размера и цвета точек соответственно:
df. plot . scatter (x=' x ', y=' y ', s= 60 , c=' green ')
Пример 2: использование Matplotlib
Следующий код показывает, как использовать функцию pyplot.scatter() для создания диаграммы рассеяния:
import pandas as pd import matplotlib. pyplot as plt #createDataFrame df = pd. DataFrame ({'x': [1, 3, 3, 4, 5, 7, 9, 12, 13, 15], 'y': [5, 7, 9, 7, 6, 12, 14, 18, 15, 22]}) #create scatterplot plt. scatter (df.x, df.y)
Обратите внимание, что вы можете использовать аргументы s и c для изменения размера и цвета точек соответственно:
plt. scatter (df.x, df.y, s= 60 , c=' purple ')
Дополнительные уроки по Python вы можете найти здесь .