Jak obliczyć korelację częściową w programie excel


W statystyce często używamy współczynnika korelacji Pearsona do pomiaru liniowej zależności między dwiema zmiennymi. Czasami jednak chcemy zrozumieć związek między dwiema zmiennymi , kontrolując trzecią zmienną .

Załóżmy na przykład, że chcemy zmierzyć związek między liczbą godzin nauki studenta a oceną z egzaminu końcowego, kontrolując jednocześnie aktualną ocenę studenta z zajęć. W tym przypadku moglibyśmy zastosować częściową korelację do pomiaru związku między przepracowanymi godzinami a oceną końcową z egzaminu.

W tym samouczku wyjaśniono, jak obliczyć częściową korelację w programie Excel.

Przykład: korelacja częściowa w Excelu

Załóżmy, że mamy zbiór danych, który wyświetla następujące informacje dla 10 uczniów:

  • Aktualna ocena w klasie
  • Godziny spędzone na nauce do egzaminu końcowego
  • Końcowy wynik egzaminu

Wykonaj poniższe kroki, aby znaleźć częściową korelację między przestudiowanymi godzinami a oceną z egzaminu, kontrolując jednocześnie aktualną ocenę.

Krok 1: Oblicz korelację każdej pary.

Najpierw obliczymy korelację pomiędzy każdą kombinacją par zmiennych:

Krok 2: Oblicz częściową korelację między godzinami a wynikiem egzaminu.

Wzór na obliczenie częściowej korelacji pomiędzy zmienną A i zmienną B przy uwzględnieniu zmiennej C jest następujący:

Częściowa korelacja = (r A,B – r A,C *r B,C ) / √((1-r 2 A,B )(1-r 2 B,C ))

Poniższy zrzut ekranu pokazuje, jak użyć tej formuły do obliczenia częściowej korelacji między godzinami a oceną z egzaminu, kontrolując bieżącą ocenę:

Jak obliczyć korelację częściową w programie Excel

Częściowa korelacja wynosi 0,190626 . Aby określić, czy ta korelacja jest istotna statystycznie, możemy znaleźć odpowiednią wartość p.

Krok 3: Oblicz wartość p korelacji częściowej.

Statystykę testu t można obliczyć w następujący sposób:

t = r√(n-3) / √(1-r 2 )

Poniższy zrzut ekranu pokazuje, jak używać tej formuły do obliczenia statystyki testowej i odpowiadającej jej wartości p:

Częściowy test korelacji dla istotności w programie Excel

Statystyka testu t wynosi 0,51377 . Całkowita liczba stopni swobody wynosi n-3 = 10-3 = 7 . Odpowiednia wartość p wynosi 0,623228 . Ponieważ wartość ta jest nie mniejsza niż 0,05, oznacza to, że częściowa korelacja pomiędzy godzinami a wynikami egzaminu nie jest istotna statystycznie.

Dodaj komentarz

Twój adres e-mail nie zostanie opublikowany. Wymagane pola są oznaczone *