Jak utworzyć macierz kowariancji w r


Kowariancja jest miarą tego, jak zmiany jednej zmiennej są powiązane ze zmianami drugiej zmiennej. Mówiąc dokładniej, jest to miara stopnia, w jakim dwie zmienne są liniowo powiązane.

Macierz kowariancji to macierz kwadratowa, która pokazuje kowariancję pomiędzy wieloma różnymi zmiennymi. Może to być przydatny sposób zrozumienia, w jaki sposób różne zmienne są powiązane w zbiorze danych.

Poniższy przykład pokazuje, jak utworzyć macierz kowariancji w R.

Jak utworzyć macierz kowariancji w R

Wykonaj następujące kroki, aby utworzyć macierz kowariancji w R.

Krok 1: Utwórz ramkę danych.

Najpierw utworzymy ramkę danych zawierającą wyniki testów 10 różnych uczniów z trzech przedmiotów: matematyki, nauk ścisłych i historii.

 #create data frame
data <- data.frame(math = c(84, 82, 81, 89, 73, 94, 92, 70, 88, 95),
                   science = c(85, 82, 72, 77, 75, 89, 95, 84, 77, 94),
                   history = c(97, 94, 93, 95, 88, 82, 78, 84, 69, 78))

#view data frame
data

   math science history
1 84 85 97
2 82 82 94
3 81 72 93
4 89 77 95
5 73 75 88
6 94 89 82
7 92 95 78
8 70 84 84
9 88 77 69
10 95 94 78

Krok 2: Utwórz macierz kowariancji.

Następnie utworzymy macierz kowariancji dla tego zbioru danych za pomocą funkcji cov() :

 #create covariance matrix
cov(data)

             math science history
math 72.17778 36.88889 -27.15556
science 36.88889 62.66667 -26.77778
history -27.15556 -26.77778 83.95556

Krok 3: Interpretacja macierzy kowariancji.

Wartości wzdłuż przekątnych macierzy są po prostu wariancjami każdego przedmiotu. Na przykład:

  • Wariancja wyników z matematyki wynosi 72,18
  • Wariancja wyników w nauce wynosi 62,67
  • Historyczna wariancja wyniku wynosi 83,96

Pozostałe wartości macierzy reprezentują kowariancje pomiędzy różnymi podmiotami. Na przykład:

  • Kowariancja między wynikami z matematyki i przedmiotów ścisłych wynosi 36,89.
  • Kowariancja między wynikami z matematyki i historii wynosi -27,16.
  • Kowariancja między wynikami z nauk ścisłych i historii wynosi -26,78.

Dodatnia liczba kowariancji wskazuje, że dwie zmienne mają tendencję do wzrostu lub spadku w tandemie. Na przykład matematyka i przedmioty ścisłe mają dodatnią kowariancję (36,89), co wskazuje, że uczniowie, którzy uzyskują wysokie wyniki z matematyki, zwykle osiągają wysokie wyniki w przedmiotach ścisłych. I odwrotnie, uczniowie, którzy osiągają słabe wyniki w matematyce, zwykle osiągają słabe wyniki w naukach ścisłych.

Ujemna liczba kowariancji wskazuje, że w miarę wzrostu jednej zmiennej druga zmienna ma tendencję do zmniejszania się. Na przykład matematyka i historia mają ujemną kowariancję (-27,16), co wskazuje, że uczniowie osiągający dobre wyniki z matematyki zwykle osiągają słabe wyniki z historii. I odwrotnie, uczniowie, którzy osiągają niskie wyniki z matematyki, zwykle osiągają wysokie wyniki z historii.

Więcej samouczków R znajdziesz tutaj .

Dodaj komentarz

Twój adres e-mail nie zostanie opublikowany. Wymagane pola są oznaczone *