Jak ręcznie obliczyć współczynnik korelacji pearsona


Współczynnik korelacji Pearsona mierzy liniowe powiązanie między dwiema zmiennymi.

Zawsze przyjmuje wartość z zakresu od -1 do 1, gdzie:

  • -1 oznacza całkowicie ujemną korelację liniową pomiędzy dwiema zmiennymi
  • Wartość 0 oznacza brak liniowej korelacji pomiędzy dwiema zmiennymi
  • 1 wskazuje doskonale dodatnią korelację liniową pomiędzy dwiema zmiennymi

Wzór na obliczenie współczynnika korelacji Pearsona, oznaczonego r , jest następujący:

Źródło: Wikipedia

W tym samouczku przedstawiono krok po kroku przykład ręcznego obliczenia współczynnika korelacji Pearsona dla następującego zestawu danych:

Krok 1: Oblicz średnią X i Y

Najpierw obliczymy średnią wartości X i Y:

Krok 2: Oblicz różnicę między średnimi

Następnie obliczymy różnicę między każdą z poszczególnych wartości X i Y oraz ich odpowiednie średnie:

Krok 3: Oblicz pozostałe wartości

Następnie obliczymy pozostałe wartości potrzebne do uzupełnienia wzoru na współczynnik korelacji Pearsona:

Krok 4: Oblicz sumy

Następnie obliczymy sumy trzech ostatnich kolumn:

Krok 5: Oblicz współczynnik korelacji Pearsona

Teraz po prostu podłączymy sumy z poprzedniego kroku do wzoru na współczynnik korelacji Pearsona:

Ręcznie współczynnik korelacji Pearsona

Współczynnik korelacji Pearsona okazuje się wynosić 0,947 .

Ponieważ wartość ta jest bliska 1, oznacza to, że X i Y są silnie dodatnio skorelowane.

Innymi słowy, wraz ze wzrostem wartości X wartość Y również wzrasta w wysoce przewidywalny sposób.

Dodatkowe zasoby

Wprowadzenie do współczynnika korelacji Pearsona
Jak znaleźć przedział ufności dla współczynnika korelacji

Dodaj komentarz

Twój adres e-mail nie zostanie opublikowany. Wymagane pola są oznaczone *