So erstellen sie eine kovarianzmatrix in r


Kovarianz ist ein Maß dafür, wie Änderungen einer Variablen mit Änderungen einer zweiten Variablen verbunden sind. Genauer gesagt ist es ein Maß für den Grad, in dem zwei Variablen linear miteinander verbunden sind.

Eine Kovarianzmatrix ist eine quadratische Matrix, die die Kovarianz zwischen vielen verschiedenen Variablen zeigt. Dies kann eine nützliche Methode sein, um zu verstehen, wie verschiedene Variablen in einem Datensatz zusammenhängen.

Das folgende Beispiel zeigt, wie man eine Kovarianzmatrix in R erstellt.

So erstellen Sie eine Kovarianzmatrix in R

Führen Sie die folgenden Schritte aus, um eine Kovarianzmatrix in R zu erstellen.

Schritt 1: Erstellen Sie den Datenrahmen.

Zuerst erstellen wir einen Datenrahmen, der die Testergebnisse von 10 verschiedenen Schülern in drei Fächern enthält: Mathematik, Naturwissenschaften und Geschichte.

 #create data frame
data <- data.frame(math = c(84, 82, 81, 89, 73, 94, 92, 70, 88, 95),
                   science = c(85, 82, 72, 77, 75, 89, 95, 84, 77, 94),
                   history = c(97, 94, 93, 95, 88, 82, 78, 84, 69, 78))

#view data frame
data

   math science history
1 84 85 97
2 82 82 94
3 81 72 93
4 89 77 95
5 73 75 88
6 94 89 82
7 92 95 78
8 70 84 84
9 88 77 69
10 95 94 78

Schritt 2: Erstellen Sie die Kovarianzmatrix.

Als nächstes erstellen wir die Kovarianzmatrix für diesen Datensatz mit der Funktion cov() :

 #create covariance matrix
cov(data)

             math science history
math 72.17778 36.88889 -27.15556
science 36.88889 62.66667 -26.77778
history -27.15556 -26.77778 83.95556

Schritt 3: Interpretieren Sie die Kovarianzmatrix.

Die Werte entlang der Diagonalen der Matrix sind einfach die Varianzen jedes Subjekts. Zum Beispiel:

  • Die Varianz der Mathematikergebnisse beträgt 72,18
  • Die Varianz der naturwissenschaftlichen Ergebnisse beträgt 62,67
  • Die historische Score-Varianz beträgt 83,96

Die anderen Werte der Matrix stellen die Kovarianzen zwischen den verschiedenen Subjekten dar. Zum Beispiel:

  • Die Kovarianz zwischen den Ergebnissen in Mathematik und Naturwissenschaften beträgt 36,89.
  • Die Kovarianz zwischen Mathematik- und Geschichtsergebnissen beträgt -27,16.
  • Die Kovarianz zwischen den Ergebnissen in Naturwissenschaften und Geschichte beträgt -26,78.

Eine positive Zahl für die Kovarianz zeigt an, dass zwei Variablen tendenziell gleichzeitig zunehmen oder abnehmen. Beispielsweise weisen Mathematik und Naturwissenschaften eine positive Kovarianz (36,89) auf, was darauf hindeutet, dass Schüler, die in Mathematik gute Ergebnisse erzielen, tendenziell auch in Naturwissenschaften gute Ergebnisse erzielen. Umgekehrt schneiden Schüler, die in Mathematik schlecht abschneiden, tendenziell auch in den Naturwissenschaften schlecht ab.

Eine negative Zahl für die Kovarianz bedeutet, dass eine zweite Variable tendenziell abnimmt, wenn eine Variable zunimmt. Beispielsweise weisen Mathematik und Geschichte eine negative Kovarianz auf (-27,16), was darauf hindeutet, dass Schüler mit guten Leistungen in Mathematik tendenziell schlechte Leistungen in Geschichte erbringen. Umgekehrt erzielen Schüler, die in Mathematik schlecht abschneiden, tendenziell gute Ergebnisse in Geschichte.

Weitere R-Tutorials finden Sie hier .

Einen Kommentar hinzufügen

Deine E-Mail-Adresse wird nicht veröffentlicht. Erforderliche Felder sind mit * markiert