Comment créer une matrice de covariance dans Google Sheets
La covariance est une mesure de la façon dont les changements dans une variable sont associés aux changements dans une deuxième variable. Plus précisément, il s’agit d’une mesure du degré auquel deux variables sont linéairement associées.
La formule pour calculer la covariance entre deux variables, X et Y est :
COV( X , Y ) = Σ(x- x )(y- y ) / n
Une matrice de covariance est une matrice carrée qui montre la covariance entre de nombreuses variables différentes. Cela peut être un moyen utile de comprendre comment les différentes variables sont liées dans un ensemble de données.
L’exemple suivant montre comment créer une matrice de covariance dans Google Sheets pour un ensemble de données donné.
Comment créer une matrice de covariance dans Google Sheets
Supposons que nous disposions de l’ensemble de données suivant qui montre les résultats aux tests de 10 étudiants différents dans trois matières : mathématiques, sciences et histoire.
Pour créer une matrice de covariance pour cet ensemble de données, nous pouvons utiliser la fonction COVAR() avec la syntaxe suivante :
COVAR(données_y, données_x)
La matrice de covariance de cet ensemble de données est affichée dans les cellules B15 : D17 tandis que les formules utilisées pour créer la matrice de covariance sont présentées dans les cellules B21 : D23 ci-dessous :
Comment interpréter une matrice de covariance
Une fois que nous disposons d’une matrice de covariance, il est simple d’interpréter les valeurs de la matrice.
Les valeurs le long des diagonales de la matrice sont simplement les variances de chaque sujet. Par exemple:
- La variance des résultats en mathématiques est de 64,96
- La variance des scores en sciences est de 56,4
- La variance des scores historiques est de 75,56
Les autres valeurs de la matrice représentent les covariances entre les différents sujets. Par exemple:
- La covariance entre les scores en mathématiques et en sciences est de 33,2.
- La covariance entre les scores en mathématiques et en histoire est de -24,44.
- La covariance entre les scores en sciences et en histoire est de -24,1.
Un nombre positif pour la covariance indique que deux variables ont tendance à augmenter ou diminuer en tandem. Par exemple, les mathématiques et les sciences ont une covariance positive (33,2), ce qui indique que les élèves qui obtiennent des résultats élevés en mathématiques ont également tendance à obtenir des résultats élevés en sciences. De même, les élèves qui obtiennent de faibles résultats en mathématiques ont également tendance à obtenir de faibles résultats en sciences.
Un nombre négatif pour la covariance indique que lorsqu’une variable augmente, une deuxième variable a tendance à diminuer. Par exemple, les mathématiques et l’histoire ont une covariance négative (-24,44), ce qui indique que les élèves qui obtiennent des résultats élevés en mathématiques ont tendance à avoir des résultats faibles en histoire. De même, les élèves qui obtiennent de faibles résultats en mathématiques ont tendance à obtenir des résultats élevés en histoire.
Ressources additionnelles
Comment créer une matrice de covariance dans Excel
Comment créer une matrice de covariance dans R
Comment créer une matrice de covariance en Python
Comment créer une matrice de covariance dans SPSS