Jak utworzyć i zinterpretować macierz korelacji w programie excel


Jednym ze sposobów ilościowego określenia związku między dwiema zmiennymi jest użycie współczynnika korelacji Pearsona , który jest miarą liniowego związku między dwiema zmiennymi .

Ma wartość od -1 do 1, gdzie:

  • -1 oznacza całkowicie ujemną korelację liniową pomiędzy dwiema zmiennymi
  • Wartość 0 oznacza brak liniowej korelacji pomiędzy dwiema zmiennymi
  • 1 wskazuje doskonale dodatnią korelację liniową pomiędzy dwiema zmiennymi

Im współczynnik korelacji jest bardziej od zera, tym silniejszy jest związek między obiema zmiennymi.

Jednak w niektórych przypadkach chcemy zrozumieć korelację między wieloma parami zmiennych.

W takich przypadkach możemy utworzyć macierz korelacji , która jest kwadratową tabelą pokazującą współczynniki korelacji pomiędzy kilkoma parami kombinacji zmiennych.

W tym samouczku wyjaśniono, jak utworzyć i zinterpretować macierz korelacji w programie Excel.

Jak utworzyć macierz korelacji w programie Excel

Załóżmy, że mamy następujący zestaw danych, który pokazuje średnią liczbę punktów, zbiórek i asyst dla 10 koszykarzy:

Aby utworzyć macierz korelacji dla tego zbioru danych, przejdź do zakładki Dane na górnej wstążce Excela i kliknij Analiza danych .

Pakiet narzędzi do analizy danych w programie Excel

Jeśli nie widzisz tej opcji, musisz najpierw załadować darmowy pakiet narzędzi do analizy danych w programie Excel .

W nowym oknie, które się pojawi, wybierz Korelacja i kliknij OK .

Macierz korelacji z pakietem narzędzi do analizy danych w programie Excel

W polu Zakres wejściowy wybierz komórki, w których znajdują się dane (łącznie z pierwszym wierszem z etykietami). Zaznacz pole obok Etykiet w pierwszym rzędzie . W polu Zakres wyjściowy wybierz komórkę, w której chcesz wyświetlić macierz korelacji. Następnie kliknij OK .

Macierz korelacji w Excelu

Spowoduje to automatyczne utworzenie następującej macierzy korelacji:

Dane wyjściowe macierzy korelacji w programie Excel

Jak interpretować macierz korelacji w programie Excel

Wartości w poszczególnych komórkach macierzy korelacji mówią nam o współczynniku korelacji Pearsona pomiędzy każdą parą kombinacji zmiennych. Na przykład:

Korelacja punktów i zbiórek: -0,04639. Punkty i zbiórki są nieco ujemnie skorelowane, ale wartość ta jest tak bliska zeru, że nie ma mocnych dowodów na istotny związek między tymi dwiema zmiennymi.

Korelacja punktów i asyst: 0,121871. Punkty i asysty są nieco dodatnio skorelowane, ale wartość ta jest również dość bliska zeru, więc nie ma mocnych dowodów na istotny związek między tymi dwiema zmiennymi.

Korelacja między zbiórkami i asystami: 0,713713. Zbiórki i asysty są silnie dodatnio skorelowane. Oznacza to, że gracze, którzy mają więcej zbiórek, mają również zwykle więcej asyst.

Należy zauważyć, że wszystkie wartości diagonalne macierzy korelacji wynoszą 1, ponieważ korelacja między zmienną a nią samą wynosi zawsze 1. W praktyce liczba ta nie jest przydatna do interpretacji.

Bonus: wizualizuj współczynniki korelacji

Prostym sposobem wizualizacji wartości współczynników korelacji w tabeli jest zastosowanie do tabeli formatowania warunkowego .

Na górnej wstążce programu Excel przejdź do karty Strona główna , a następnie do grupy Style .

Kliknij opcję Wykres formatowania warunkowego , następnie Skale kolorów , a następnie Skala kolorów zielono-żółto-czerwona .

Spowoduje to automatyczne zastosowanie następującej skali kolorów do macierzy korelacji:

Macierz korelacji z formatowaniem warunkowym w programie Excel

Pomaga nam to łatwo zwizualizować siłę korelacji pomiędzy zmiennymi.

Jest to szczególnie przydatna wskazówka, jeśli pracujemy z macierzą korelacji z wieloma zmiennymi, ponieważ pomaga nam szybko zidentyfikować zmienne, które mają najsilniejsze korelacje.

Powiązane: Co uważa się za „silną” korelację?

Dodatkowe zasoby

Poniższe samouczki wyjaśniają, jak wykonywać inne typowe zadania w języku R:

Jak utworzyć macierz rozrzutu w programie Excel
Jak wykonać test korelacji w programie Excel

Dodaj komentarz

Twój adres e-mail nie zostanie opublikowany. Wymagane pola są oznaczone *