Hoe maak je een covariantiematrix in r
Covariantie is een maatstaf voor hoe veranderingen in één variabele verband houden met veranderingen in een tweede variabele. Meer specifiek is het een maatstaf voor de mate waarin twee variabelen lineair geassocieerd zijn.
Een covariantiematrix is een vierkante matrix die de covariantie tussen veel verschillende variabelen weergeeft. Dit kan een nuttige manier zijn om te begrijpen hoe verschillende variabelen in een dataset met elkaar samenhangen.
Het volgende voorbeeld laat zien hoe u een covariantiematrix in R maakt.
Hoe maak je een covariantiematrix in R
Gebruik de volgende stappen om een covariantiematrix in R te maken.
Stap 1: Maak het dataframe.
Eerst maken we een dataframe met de testscores van tien verschillende leerlingen in drie vakken: wiskunde, natuurwetenschappen en geschiedenis.
#create data frame data <- data.frame(math = c(84, 82, 81, 89, 73, 94, 92, 70, 88, 95), science = c(85, 82, 72, 77, 75, 89, 95, 84, 77, 94), history = c(97, 94, 93, 95, 88, 82, 78, 84, 69, 78)) #view data frame data math science history 1 84 85 97 2 82 82 94 3 81 72 93 4 89 77 95 5 73 75 88 6 94 89 82 7 92 95 78 8 70 84 84 9 88 77 69 10 95 94 78
Stap 2: Maak de covariantiematrix.
Vervolgens zullen we de covariantiematrix voor deze dataset maken met behulp van de cov() functie:
#create covariance matrix
cov(data)
math science history
math 72.17778 36.88889 -27.15556
science 36.88889 62.66667 -26.77778
history -27.15556 -26.77778 83.95556
Stap 3: Interpreteer de covariantiematrix.
De waarden langs de diagonalen van de matrix zijn eenvoudigweg de varianties van elk onderwerp. Bijvoorbeeld:
- De variantie van wiskundescores is 72,18
- De variantie van wetenschapsscores is 62,67
- Historische scorevariantie is 83,96
De overige waarden van de matrix vertegenwoordigen de covarianties tussen de verschillende onderwerpen. Bijvoorbeeld:
- De covariantie tussen wiskunde- en natuurwetenschappenscores is 36,89.
- De covariantie tussen wiskunde- en geschiedenisscores is -27,16.
- De covariantie tussen wetenschaps- en geschiedenisscores is -26,78.
Een positief getal voor covariantie geeft aan dat twee variabelen de neiging hebben om tegelijkertijd te stijgen of dalen. Wiskunde en natuurwetenschappen hebben bijvoorbeeld een positieve covariantie (36,89), wat aangeeft dat leerlingen die hoog scoren op wiskunde ook vaak hoog scoren op natuurwetenschappen. Omgekeerd presteren leerlingen die slecht presteren in de wiskunde ook vaak slecht in de natuurwetenschappen.
Een negatief getal voor covariantie geeft aan dat naarmate één variabele toeneemt, een tweede variabele de neiging heeft af te nemen. Wiskunde en geschiedenis hebben bijvoorbeeld een negatieve covariantie (-27,16), wat aangeeft dat leerlingen die hoog presteren in wiskunde doorgaans laag presteren in geschiedenis. Omgekeerd scoren leerlingen die laag scoren op wiskunde doorgaans hoog op geschiedenis.
Meer R-tutorials vindt u hier .