Come creare una matrice di covarianza in fogli google
La covarianza è una misura di come i cambiamenti in una variabile sono associati ai cambiamenti in una seconda variabile. Più specificamente, è una misura del grado in cui due variabili sono linearmente associate.
La formula per calcolare la covarianza tra due variabili, X e Y è:
COV( X , Y ) = Σ(x- x )(y- y ) / n
Una matrice di covarianza è una matrice quadrata che mostra la covarianza tra molte variabili diverse. Questo può essere un modo utile per comprendere come le diverse variabili sono correlate in un set di dati.
L’esempio seguente mostra come creare una matrice di covarianza in Fogli Google per un determinato set di dati.
Come creare una matrice di covarianza in Fogli Google
Supponiamo di avere il seguente set di dati che mostra i punteggi dei test di 10 studenti diversi in tre materie: matematica, scienze e storia.
Per creare una matrice di covarianza per questo set di dati, possiamo utilizzare la funzione COVAR() con la seguente sintassi:
COVAR(dati_y; dati_x)
La matrice di covarianza per questo set di dati è mostrata nelle celle B15:D17 mentre le formule utilizzate per creare la matrice di covarianza sono mostrate nelle celle B21:D23 di seguito:
Come interpretare una matrice di covarianza
Una volta che abbiamo una matrice di covarianza, è semplice interpretare i valori della matrice.
I valori lungo le diagonali della matrice sono semplicemente le varianze di ciascun soggetto. Per esempio:
- La varianza dei punteggi di matematica è 64,96
- La varianza dei punteggi scientifici è 56,4
- La varianza del punteggio storico è 75,56
Gli altri valori della matrice rappresentano le covarianze tra i diversi soggetti. Per esempio:
- La covarianza tra i punteggi di matematica e scienze è 33,2.
- La covarianza tra i punteggi di matematica e storia è -24,44.
- La covarianza tra i punteggi di scienza e storia è -24,1.
Un numero positivo per la covarianza indica che due variabili tendono ad aumentare o diminuire in tandem. Ad esempio, matematica e scienze hanno una covarianza positiva (33,2), indicando che gli studenti che ottengono punteggi elevati in matematica tendono ad ottenere punteggi elevati anche in scienze. Allo stesso modo, gli studenti che ottengono scarsi risultati in matematica tendono ad avere scarsi risultati anche in scienze.
Un numero negativo per la covarianza indica che all’aumentare di una variabile, una seconda variabile tende a diminuire. Ad esempio, matematica e storia hanno una covarianza negativa (-24,44), indicando che gli studenti che ottengono punteggi alti in matematica tendono ad avere punteggi bassi in storia. Allo stesso modo, gli studenti che ottengono punteggi bassi in matematica tendono ad ottenere punteggi alti in storia.
Risorse addizionali
Come creare una matrice di covarianza in Excel
Come creare una matrice di covarianza in R
Come creare una matrice di covarianza in Python
Come creare una matrice di covarianza in SPSS