Как рассчитать частичную корреляцию в excel
В статистике мы часто используем коэффициент корреляции Пирсона для измерения линейной зависимости между двумя переменными. Однако иногда мы хотим понять взаимосвязь между двумя переменными , одновременно контролируя третью переменную .
Например, предположим, что мы хотим измерить связь между количеством учебных часов учащегося и оценкой на итоговом экзамене, одновременно контролируя текущую оценку учащегося в классе. В этом случае мы могли бы использовать частичную корреляцию для измерения взаимосвязи между учебными часами и оценкой на итоговом экзамене.
В этом руководстве объясняется, как рассчитать частичную корреляцию в Excel.
Пример: частичная корреляция в Excel
Допустим, у нас есть набор данных, который отображает следующую информацию для 10 студентов:
- Текущая оценка в классе
- Часы, потраченные на подготовку к выпускному экзамену
- Итоговый результат экзамена
Используйте следующие шаги, чтобы найти частичную корреляцию между учебными часами и оценкой на экзамене, контролируя текущую оценку.
Шаг 1: Рассчитайте каждую парную корреляцию.
Сначала рассчитаем корреляцию между каждой парной комбинацией переменных:
Шаг 2. Рассчитайте частичную корреляцию между часами и баллами на экзамене.
Формула для расчета частичной корреляции между переменной A и переменной B с учетом переменной C выглядит следующим образом:
Частичная корреляция = (r A,B – r A,C *r B,C ) / √((1-r 2 A,B )(1-r 2 B,C ))
На следующем снимке экрана показано, как использовать эту формулу для расчета частичной корреляции между количеством часов и оценкой экзамена с учетом текущей оценки:
Частная корреляция составляет 0,190626 . Чтобы определить, является ли эта корреляция статистически значимой, мы можем найти соответствующее значение p.
Шаг 3: Рассчитайте p-значение частной корреляции.
Статистику t- критерия можно рассчитать следующим образом:
т = r√(n-3) / √(1-r 2 )
На следующем снимке экрана показано, как использовать эту формулу для расчета статистики теста и соответствующего значения p:
Статистика t- теста равна 0,51377 . Общее количество степеней свободы n-3 = 10-3 = 7 . Соответствующее значение p составляет 0,623228 . Поскольку это значение не менее 0,05, это означает, что частичная корреляция между часами и результатами экзамена не является статистически значимой.