So erstellen sie eine streudiagrammmatrix in r (2 beispiele)
Eine Streudiagrammmatrix ist eine Streudiagrammmatrix, mit der Sie die paarweise Beziehung zwischen verschiedenen Variablen in einem Datensatz verstehen können.
Es gibt zwei gängige Methoden zum Erstellen einer Streudiagrammmatrix in R:
Methode 1: Verwenden Sie Base R
#create scatterplot matrix (pch=20 means to use a solid circle for points) plot(df, pch= 20 )
Methode 2: Verwenden Sie die Pakete ggplot2 und GGally
library (ggplot2) library (GGally) #create scatterplot matrix ggpairs(df)
Die folgenden Beispiele zeigen, wie jede Methode in der Praxis mit dem folgenden Datenrahmen in R verwendet wird:
#create data frame df <- data. frame (points=c(99, 90, 86, 88, 95, 99, 101, 104), assists=c(33, 28, 31, 39, 40, 40, 35, 47), rebounds=c(30, 28, 24, 24, 20, 20, 15, 12)) #view first few rows of data frame head(df) points assists rebounds 1 99 33 30 2 90 28 28 3 86 31 24 4 88 39 24 5 95 40 20 6 99 40 20
Beispiel 1: Erstellen Sie eine Streudiagrammmatrix mit Basis R
Wir können die Basisfunktion plot() von R verwenden, um eine Streudiagrammmatrix für jede Variable in unserem Datenrahmen zu erstellen:
#create scatterplot matrix
plot(df, pch= 20 , cex= 1.5 , col=' steelblue ')
Die Interpretation der Matrix ist wie folgt:
- Variablennamen werden entlang der diagonalen Kästchen angezeigt.
- Alle anderen Felder zeigen ein Streudiagramm der Beziehung zwischen jeder paarweisen Kombination von Variablen. Das Feld in der oberen rechten Ecke der Matrix zeigt beispielsweise ein Streudiagramm der Werte für Punkte und Rebounds an. Der mittlere linke Bereich zeigt ein Streudiagramm der Werte für Punkte und Assists etc.
Beachten Sie, dass cex die Größe der Punkte im Pfad und col die Farbe der Punkte steuert.
Beispiel 2: Erstellen Sie eine Streudiagrammmatrix mit ggplot2 und GGally
Wir können auch die Funktion ggpairs() aus den Paketen ggplot2 und GGally in R verwenden, um eine Streudiagrammmatrix für jede Variable in unserem Datenrahmen zu erstellen:
library (ggplot2) library (GGally) #create scatterplot matrix ggpairs(df)
Diese Streudiagrammmatrix enthält die gleichen Streudiagramme wie die R- Basisplot()- Funktion, aber zusätzlich können wir auch den Korrelationskoeffizienten zwischen jeder paarweisen Kombination von Variablen sowie ein Dichtediagramm für jede einzelne Variable sehen.
Wir können zum Beispiel sehen:
- Der Korrelationskoeffizient zwischen Assists und Punkten beträgt 0,571 .
- Der Korrelationskoeffizient zwischen Rebounds und Punkten beträgt -0,598 .
- Der Korrelationskoeffizient zwischen Rebounds und Assists beträgt -0,740 .
Der kleine Stern ( * ) neben -0,740 zeigt außerdem an, dass die Korrelation zwischen Rebounds und Assists statistisch signifikant ist.
Zusätzliche Ressourcen
Die folgenden Tutorials erklären, wie Sie andere häufige Aufgaben in R ausführen:
So erstellen Sie eine Korrelationsmatrix in R
So erstellen Sie Punktwolken nach Gruppen in R