Как создать линию наилучшего соответствия в excel


В статистике линия наилучшего соответствия — это линия, которая лучше всего «соответствует» или описывает взаимосвязь между переменной-предиктором и переменной отклика .

В следующем пошаговом примере показано, как создать линию наилучшего соответствия в Excel.

Шаг 1: Введите данные

Сначала давайте введем следующий набор данных, который показывает количество часов, потраченных на тренировки, и общее количество очков, набранных восемью разными баскетболистами:

Шаг 2. Создайте диаграмму рассеяния

Далее давайте создадим диаграмму рассеяния, чтобы визуализировать связь между двумя переменными.

Для этого выделите ячейки в диапазоне A2:B9 , затем щелкните вкладку «Вставка» на верхней ленте, затем выберите параметр « Разброс» в группе «Диаграммы» :

Следующее облако точек будет создано автоматически:

Шаг 3. Добавьте наиболее подходящую линию.

Чтобы добавить линию наилучшего соответствия на диаграмму рассеяния, щелкните в любом месте графика, затем щелкните зеленый знак плюса (+), который появляется в правом верхнем углу графика.

Затем щелкните стрелку рядом с надписью «Линия тренда» и выберите «Дополнительные параметры» :

На появившейся панели «Формат линии тренда» нажмите кнопку рядом с параметром « Линейный как линия тренда», а затем установите флажок «Показать уравнение на диаграмме »:

На графике появятся наиболее подходящая линия и ее уравнение:

линия наилучшего соответствия в Excel

Шаг 4: Интерпретируйте линию наилучшего соответствия

Из графика мы видим, что линия наилучшего соответствия имеет следующее уравнение:

у = 2,3095x – 0,8929

Вот как интерпретировать это уравнение:

  • За каждый дополнительный час занятий среднее количество набранных баллов увеличивается на 2,3095 .
  • Для игрока, который тренируется ноль часов, среднее количество набранных очков должно составлять -0,8929 .

Обратите внимание, что не всегда имеет смысл интерпретировать исходное значение в уравнении регрессии.

Например, игрок не может набрать отрицательные очки.

В этом конкретном примере нас в первую очередь интересует значение наклона линии регрессии, которое составляет 2,3095 .

Дополнительные ресурсы

В следующих руководствах объясняется, как выполнять другие распространенные задачи в Excel:

Как выполнить простую линейную регрессию в Excel
Как выполнить множественную линейную регрессию в Excel
Как посчитать R-квадрат в Excel

Добавить комментарий

Ваш адрес email не будет опубликован. Обязательные поля помечены *