Co to jest korelacja rzędu zerowego?
W statystyce korelacja między dwiema zmiennymi mówi nam o związku między tymi dwiema zmiennymi.
Jeden z najbardziej podstawowych typów korelacji znany jest jako korelacja zerowego rzędu , która odnosi się do korelacji między dwiema zmiennymi bez kontrolowania możliwego wpływu innych zmiennych.
Przykładem tego typu korelacji jest współczynnik korelacji Pearsona , który mierzy liniowe powiązanie między dwiema zmiennymi i może przyjmować wartości od -1 do 1 gdzie:
- -1 oznacza całkowicie ujemną korelację liniową pomiędzy dwiema zmiennymi
- Wartość 0 oznacza brak liniowej korelacji pomiędzy dwiema zmiennymi
- 1 wskazuje doskonale dodatnią korelację liniową pomiędzy dwiema zmiennymi
Im korelacja jest dalej od zera, tym silniejszy związek między dwiema zmiennymi.
Korelacje pierwszego i drugiego rzędu
Jeśli obliczymy korelację między dwiema zmiennymi A i B, kontrolując wpływ trzeciej zmiennej C, nazwalibyśmy korelację między A i B korelacją pierwszego rzędu .
Podobnie, jeśli obliczymy korelację między dwiema zmiennymi A i B, kontrolując wpływ zmiennych C i D, nazwalibyśmy korelację między A i B korelacją drugiego rzędu .
Przykład korelacji rzędu zerowego
Załóżmy, że mamy następujący zbiór danych, który pokazuje liczbę godzin spędzonych na nauce i oceny uzyskane na egzaminie przez 10 różnych uczniów:
Okazuje się, że korelacja między tymi dwiema zmiennymi wynosi 0,762 . Można to uznać za korelację zerowego rzędu między dwiema zmiennymi, ponieważ nie kontrolujemy potencjalnego wpływu trzeciej zmiennej.
Jednak w rzeczywistości możliwe jest, że na związek między tymi dwiema zmiennymi wpływają inne czynniki.
Na przykład aktualna ocena ucznia z zajęć może mieć wpływ na jego wynik egzaminu. Załóżmy, że mamy również dostęp do tych danych:
Gdybyśmy następnie obliczyli korelację między godzinami a egzaminem , kontrolując wpływ bieżącej oceny , odkrylibyśmy, że korelacja pierwszego rzędu między godzinami a egzaminem wynosi 0,578 .
Oznacza to, że nadal istnieje dość silna dodatnia korelacja pomiędzy przepracowanymi godzinami a oceną z egzaminu, nawet po uwzględnieniu wpływu aktualnej oceny studenta na zajęciach.
Uwaga: Korelacja pierwszego rzędu jest czasami nazywana korelacją częściową . W tym samouczku wyjaśniono, jak obliczyć korelacje częściowe w programie Excel.
Korelacje rzędu zerowego w macierzy korelacji
tworzymy macierz korelacji Ilekroć dla zbioru zmiennych współczynniki korelacji wyświetlane w macierzy są zawsze korelacjami zerowego rzędu, ponieważ są to po prostu korelacje pomiędzy każdą parą kombinacji zmiennych bez uwzględnienia wpływu innych zmiennych.
Rozważmy na przykład nasz zbiór danych z poprzedniego przykładu:
Gdybyśmy utworzyli macierz korelacji dla tego zbioru danych, wyglądałaby ona tak:
Sposób interpretacji tego jest następujący:
- Korelacja pomiędzy obecną oceną i godzinami nauki wynosi 0,689 .
- Korelacja aktualnego wyniku z wynikiem uzyskanym na egzaminie wynosi 0,637 .
- Korelacja między przestudiowanymi godzinami a wynikiem egzaminu wynosi 0,762 .
Każda z tych korelacji jest korelacją zerowego rzędu .
Dodatkowe zasoby
Poniższe samouczki zawierają dodatkowe informacje na temat współczynników korelacji:
Wprowadzenie do współczynnika korelacji Pearsona
Jak czytać macierz korelacji
Jak obliczyć korelację częściową w programie Excel