Co to jest korelacja rzędu zerowego?


W statystyce korelacja między dwiema zmiennymi mówi nam o związku między tymi dwiema zmiennymi.

Jeden z najbardziej podstawowych typów korelacji znany jest jako korelacja zerowego rzędu , która odnosi się do korelacji między dwiema zmiennymi bez kontrolowania możliwego wpływu innych zmiennych.

Przykładem tego typu korelacji jest współczynnik korelacji Pearsona , który mierzy liniowe powiązanie między dwiema zmiennymi i może przyjmować wartości od -1 do 1 gdzie:

  • -1 oznacza całkowicie ujemną korelację liniową pomiędzy dwiema zmiennymi
  • Wartość 0 oznacza brak liniowej korelacji pomiędzy dwiema zmiennymi
  • 1 wskazuje doskonale dodatnią korelację liniową pomiędzy dwiema zmiennymi

Im korelacja jest dalej od zera, tym silniejszy związek między dwiema zmiennymi.

Korelacje pierwszego i drugiego rzędu

Jeśli obliczymy korelację między dwiema zmiennymi A i B, kontrolując wpływ trzeciej zmiennej C, nazwalibyśmy korelację między A i B korelacją pierwszego rzędu .

Podobnie, jeśli obliczymy korelację między dwiema zmiennymi A i B, kontrolując wpływ zmiennych C i D, nazwalibyśmy korelację między A i B korelacją drugiego rzędu .

Przykład korelacji rzędu zerowego

Załóżmy, że mamy następujący zbiór danych, który pokazuje liczbę godzin spędzonych na nauce i oceny uzyskane na egzaminie przez 10 różnych uczniów:

Okazuje się, że korelacja między tymi dwiema zmiennymi wynosi 0,762 . Można to uznać za korelację zerowego rzędu między dwiema zmiennymi, ponieważ nie kontrolujemy potencjalnego wpływu trzeciej zmiennej.

Jednak w rzeczywistości możliwe jest, że na związek między tymi dwiema zmiennymi wpływają inne czynniki.

Na przykład aktualna ocena ucznia z zajęć może mieć wpływ na jego wynik egzaminu. Załóżmy, że mamy również dostęp do tych danych:

Przykład korelacji rzędu zerowego

Gdybyśmy następnie obliczyli korelację między godzinami a egzaminem , kontrolując wpływ bieżącej oceny , odkrylibyśmy, że korelacja pierwszego rzędu między godzinami a egzaminem wynosi 0,578 .

Oznacza to, że nadal istnieje dość silna dodatnia korelacja pomiędzy przepracowanymi godzinami a oceną z egzaminu, nawet po uwzględnieniu wpływu aktualnej oceny studenta na zajęciach.

Uwaga: Korelacja pierwszego rzędu jest czasami nazywana korelacją częściową . W tym samouczku wyjaśniono, jak obliczyć korelacje częściowe w programie Excel.

Korelacje rzędu zerowego w macierzy korelacji

tworzymy macierz korelacji Ilekroć dla zbioru zmiennych współczynniki korelacji wyświetlane w macierzy są zawsze korelacjami zerowego rzędu, ponieważ są to po prostu korelacje pomiędzy każdą parą kombinacji zmiennych bez uwzględnienia wpływu innych zmiennych.

Rozważmy na przykład nasz zbiór danych z poprzedniego przykładu:

Przykład korelacji rzędu zerowego

Gdybyśmy utworzyli macierz korelacji dla tego zbioru danych, wyglądałaby ona tak:

Sposób interpretacji tego jest następujący:

  • Korelacja pomiędzy obecną oceną i godzinami nauki wynosi 0,689 .
  • Korelacja aktualnego wyniku z wynikiem uzyskanym na egzaminie wynosi 0,637 .
  • Korelacja między przestudiowanymi godzinami a wynikiem egzaminu wynosi 0,762 .

Każda z tych korelacji jest korelacją zerowego rzędu .

Dodatkowe zasoby

Poniższe samouczki zawierają dodatkowe informacje na temat współczynników korelacji:

Wprowadzenie do współczynnika korelacji Pearsona
Jak czytać macierz korelacji
Jak obliczyć korelację częściową w programie Excel

Dodaj komentarz

Twój adres e-mail nie zostanie opublikowany. Wymagane pola są oznaczone *