Jak utworzyć macierz kowariancji w programie excel
Kowariancja jest miarą tego, jak zmiany jednej zmiennej są powiązane ze zmianami drugiej zmiennej. Mówiąc dokładniej, jest to miara stopnia, w jakim dwie zmienne są liniowo powiązane.
Wzór na obliczenie kowariancji pomiędzy dwiema zmiennymi, X i Y , wygląda następująco:
COV( X , Y ) = Σ(x- x )(y- y ) / n
Macierz kowariancji to macierz kwadratowa, która pokazuje kowariancję pomiędzy wieloma różnymi zmiennymi. Może to być prosty i użyteczny sposób zrozumienia, w jaki sposób różne zmienne są powiązane w zbiorze danych.
Poniższy przykład pokazuje, jak utworzyć macierz kowariancji w programie Excel przy użyciu prostego zbioru danych.
Jak utworzyć macierz kowariancji w programie Excel
Załóżmy, że mamy następujący zbiór danych, który pokazuje wyniki testów 10 różnych uczniów z trzech przedmiotów: matematyki, nauk ścisłych i historii.
Aby utworzyć macierz kowariancji dla tego zestawu danych, kliknij opcję Analiza danych w prawym górnym rogu programu Excel na karcie Dane .
Uwaga: Jeśli nie widzisz opcji Analiza danych, musisz najpierw załadować pakiet narzędzi do analizy danych .
Po kliknięciu tej opcji pojawi się nowe okno. Kliknij opcję Kowariancja .
W polu Zakres wejściowy wpisz „$A$1:$C$11”, ponieważ jest to zakres komórek, w których znajduje się nasz zbiór danych. Zaznacz pole Etykiety w pierwszym wierszu , aby poinformować program Excel, że etykiety naszych zmiennych znajdują się w pierwszym wierszu. Następnie w polu Zakres wyjściowy wpisz dowolną komórkę, w której ma się pojawić macierz kowariancji. Myślę, że komórka $E$2. Następnie kliknij OK .
Macierz kowariancji jest generowana automatycznie i pojawia się w komórce $E$2:
Jak interpretować macierz kowariancji
Kiedy już mamy macierz kowariancji, interpretacja wartości macierzy jest dość prosta.
Wartości wzdłuż przekątnych macierzy są po prostu wariancjami każdego przedmiotu. Na przykład:
- Wariancja wyników z matematyki wynosi 64,96
- Wariancja wyników z przedmiotów ścisłych wynosi 56,4
- Historyczna wariancja wyniku wynosi 75,56
Pozostałe wartości macierzy reprezentują kowariancje pomiędzy różnymi podmiotami. Na przykład:
- Kowariancja między wynikami z matematyki i przedmiotów ścisłych wynosi 33,2.
- Kowariancja między wynikami z matematyki i historii wynosi -24,44.
- Kowariancja między wynikami z nauk ścisłych i historii wynosi -24,1.
Dodatnia liczba kowariancji wskazuje, że dwie zmienne mają tendencję do wzrostu lub spadku w tandemie. Na przykład matematyka i przedmioty ścisłe mają dodatnią kowariancję (33,2), co wskazuje, że uczniowie, którzy uzyskują wysokie wyniki z matematyki, zwykle osiągają wysokie wyniki w przedmiotach ścisłych. Podobnie uczniowie, którzy osiągają słabe wyniki w matematyce, zwykle osiągają słabe wyniki w naukach ścisłych.
Ujemna liczba kowariancji wskazuje, że w miarę wzrostu jednej zmiennej druga zmienna ma tendencję do zmniejszania się. Na przykład matematyka i historia mają ujemną kowariancję (-24,44), co wskazuje, że uczniowie, którzy uzyskują wysokie wyniki z matematyki, zwykle osiągają niskie wyniki z historii. Podobnie uczniowie, którzy osiągają niskie wyniki z matematyki, zwykle osiągają wysokie wyniki z historii.