Jak utworzyć macierz kowariancji w r
Kowariancja jest miarą tego, jak zmiany jednej zmiennej są powiązane ze zmianami drugiej zmiennej. Mówiąc dokładniej, jest to miara stopnia, w jakim dwie zmienne są liniowo powiązane.
Macierz kowariancji to macierz kwadratowa, która pokazuje kowariancję pomiędzy wieloma różnymi zmiennymi. Może to być przydatny sposób zrozumienia, w jaki sposób różne zmienne są powiązane w zbiorze danych.
Poniższy przykład pokazuje, jak utworzyć macierz kowariancji w R.
Jak utworzyć macierz kowariancji w R
Wykonaj następujące kroki, aby utworzyć macierz kowariancji w R.
Krok 1: Utwórz ramkę danych.
Najpierw utworzymy ramkę danych zawierającą wyniki testów 10 różnych uczniów z trzech przedmiotów: matematyki, nauk ścisłych i historii.
#create data frame data <- data.frame(math = c(84, 82, 81, 89, 73, 94, 92, 70, 88, 95), science = c(85, 82, 72, 77, 75, 89, 95, 84, 77, 94), history = c(97, 94, 93, 95, 88, 82, 78, 84, 69, 78)) #view data frame data math science history 1 84 85 97 2 82 82 94 3 81 72 93 4 89 77 95 5 73 75 88 6 94 89 82 7 92 95 78 8 70 84 84 9 88 77 69 10 95 94 78
Krok 2: Utwórz macierz kowariancji.
Następnie utworzymy macierz kowariancji dla tego zbioru danych za pomocą funkcji cov() :
#create covariance matrix
cov(data)
math science history
math 72.17778 36.88889 -27.15556
science 36.88889 62.66667 -26.77778
history -27.15556 -26.77778 83.95556
Krok 3: Interpretacja macierzy kowariancji.
Wartości wzdłuż przekątnych macierzy są po prostu wariancjami każdego przedmiotu. Na przykład:
- Wariancja wyników z matematyki wynosi 72,18
- Wariancja wyników w nauce wynosi 62,67
- Historyczna wariancja wyniku wynosi 83,96
Pozostałe wartości macierzy reprezentują kowariancje pomiędzy różnymi podmiotami. Na przykład:
- Kowariancja między wynikami z matematyki i przedmiotów ścisłych wynosi 36,89.
- Kowariancja między wynikami z matematyki i historii wynosi -27,16.
- Kowariancja między wynikami z nauk ścisłych i historii wynosi -26,78.
Dodatnia liczba kowariancji wskazuje, że dwie zmienne mają tendencję do wzrostu lub spadku w tandemie. Na przykład matematyka i przedmioty ścisłe mają dodatnią kowariancję (36,89), co wskazuje, że uczniowie, którzy uzyskują wysokie wyniki z matematyki, zwykle osiągają wysokie wyniki w przedmiotach ścisłych. I odwrotnie, uczniowie, którzy osiągają słabe wyniki w matematyce, zwykle osiągają słabe wyniki w naukach ścisłych.
Ujemna liczba kowariancji wskazuje, że w miarę wzrostu jednej zmiennej druga zmienna ma tendencję do zmniejszania się. Na przykład matematyka i historia mają ujemną kowariancję (-27,16), co wskazuje, że uczniowie osiągający dobre wyniki z matematyki zwykle osiągają słabe wyniki z historii. I odwrotnie, uczniowie, którzy osiągają niskie wyniki z matematyki, zwykle osiągają wysokie wyniki z historii.
Więcej samouczków R znajdziesz tutaj .