So erstellen sie eine kovarianzmatrix in excel
Kovarianz ist ein Maß dafür, wie Änderungen einer Variablen mit Änderungen einer zweiten Variablen verbunden sind. Genauer gesagt ist es ein Maß für den Grad, in dem zwei Variablen linear miteinander verbunden sind.
Die Formel zur Berechnung der Kovarianz zwischen zwei Variablen, X und Y, lautet:
COV( X , Y ) = Σ(x- x )(y- y ) / n
Eine Kovarianzmatrix ist eine quadratische Matrix, die die Kovarianz zwischen vielen verschiedenen Variablen zeigt. Dies kann eine einfache und nützliche Möglichkeit sein, zu verstehen, wie verschiedene Variablen in einem Datensatz zusammenhängen.
Das folgende Beispiel zeigt, wie Sie mithilfe eines einfachen Datensatzes eine Kovarianzmatrix in Excel erstellen.
So erstellen Sie eine Kovarianzmatrix in Excel
Nehmen wir an, wir haben den folgenden Datensatz, der die Testergebnisse von 10 verschiedenen Schülern in drei Fächern zeigt: Mathematik, Naturwissenschaften und Geschichte.
Um eine Kovarianzmatrix für diesen Datensatz zu erstellen, klicken Sie oben rechts in Excel auf der Registerkarte „Daten“ auf die Option „Datenanalyse“ .
Hinweis: Wenn die Option „Datenanalyse“ nicht angezeigt wird, müssen Sie zuerst das Data Analysis Toolpak laden .
Sobald Sie auf diese Option klicken, erscheint ein neues Fenster. Klicken Sie auf Kovarianz .
Geben Sie im Feld „Eingabebereich “ „$A$1:$C$11“ ein, da dies der Zellbereich ist, in dem sich unser Datensatz befindet. Aktivieren Sie das Kontrollkästchen Beschriftungen in der ersten Zeile , um Excel mitzuteilen, dass sich die Beschriftungen für unsere Variablen in der ersten Zeile befinden. Geben Sie dann im Feld „Ausgabebereich“ eine beliebige Zelle ein, in der die Kovarianzmatrix angezeigt werden soll. Ich denke, Zelle $E$2. Klicken Sie dann auf OK .
Die Kovarianzmatrix wird automatisch generiert und erscheint in Zelle $E$2:
So interpretieren Sie eine Kovarianzmatrix
Sobald wir eine Kovarianzmatrix haben, ist es ganz einfach, die Werte der Matrix zu interpretieren.
Die Werte entlang der Diagonalen der Matrix sind einfach die Varianzen jedes Subjekts. Zum Beispiel:
- Die Varianz der Mathematikergebnisse beträgt 64,96
- Die Varianz der naturwissenschaftlichen Ergebnisse beträgt 56,4
- Die historische Score-Varianz beträgt 75,56
Die anderen Werte der Matrix stellen die Kovarianzen zwischen den verschiedenen Subjekten dar. Zum Beispiel:
- Die Kovarianz zwischen den Ergebnissen in Mathematik und Naturwissenschaften beträgt 33,2.
- Die Kovarianz zwischen Mathematik- und Geschichtsergebnissen beträgt -24,44.
- Die Kovarianz zwischen den Ergebnissen in Naturwissenschaften und Geschichte beträgt -24,1.
Eine positive Zahl für die Kovarianz zeigt an, dass zwei Variablen tendenziell gleichzeitig zunehmen oder abnehmen. Beispielsweise weisen Mathematik und Naturwissenschaften eine positive Kovarianz (33,2) auf, was darauf hindeutet, dass Schüler, die in Mathematik gute Ergebnisse erzielen, tendenziell auch in Naturwissenschaften gute Ergebnisse erzielen. Ebenso tendieren Schüler, die in Mathematik schlecht abschneiden, auch in Naturwissenschaften zu schlechten Leistungen.
Eine negative Zahl für die Kovarianz bedeutet, dass eine zweite Variable tendenziell abnimmt, wenn eine Variable zunimmt. Mathematik und Geschichte weisen beispielsweise eine negative Kovarianz auf (-24,44), was darauf hindeutet, dass Schüler, die in Mathematik gute Ergebnisse erzielen, in Geschichte tendenziell schlechte Ergebnisse erzielen. Ebenso erzielen Schüler, die in Mathematik schlechte Ergebnisse erzielen, tendenziell gute Ergebnisse in Geschichte.