Як створити точкову діаграму з лінією регресії в python
Часто, виконуючи просту лінійну регресію, ви можете створити діаграму розсіювання, щоб візуалізувати різні комбінації значень x і y, а також оцінену лінію регресії.
На щастя, є два простих способи створити цей тип графіка в Python. Цей підручник пояснює обидва методи з використанням таких даних:
import numpy as np
#createdata
x = np.array([1, 1, 2, 3, 4, 4, 5, 6, 7, 7, 8, 9])
y = np.array([13, 14, 17, 12, 23, 24, 25, 25, 24, 28, 32, 33])
Спосіб 1: Використовуйте Matplotlib
У наступному коді показано, як створити діаграму розсіювання з розрахунковою лінією регресії для цих даних за допомогою Matplotlib:
import matplotlib.pyplot as plt #create basic scatterplot plt.plot(x, y, 'o') #obtain m (slope) and b(intercept) of linear regression line m, b = np.polyfit(x, y, 1) #add linear regression line to scatterplot plt.plot(x, m*x+b)
Не соромтеся змінювати кольори діаграми на свій розсуд. Наприклад, ось як змінити окремі точки на зелені, а лінію на червоні:
#use green as color for individual points plt.plot(x, y, 'o', color=' green ') #obtain m (slope) and b(intercept) of linear regression line m, b = np.polyfit(x, y, 1) #use red as color for regression line plt.plot(x, m*x+b, color=' red ')
Спосіб 2: Використовуйте Seaborn
Ви також можете використовувати функцію regplot() бібліотеки візуалізації Seaborn для створення діаграми розсіювання з лінією регресії:
import seaborn as sns #create scatterplot with regression line sns.regplot(x, y, ci=None)
Зауважте, що ci=None повідомляє Seaborn приховати смуги довірчого інтервалу на графіку. Однак ви можете відобразити їх, якщо хочете:
import seaborn as sns #create scatterplot with regression line and confidence interval lines sns.regplot(x,y)
Ви можете знайти повну документацію для функції regplot() тут .
Додаткові ресурси
Як виконати просту лінійну регресію в Python
Як створити залишковий графік у Python