Jak utworzyć macierz wykresu rozrzutu w r (2 przykłady)
Macierz wykresu rozrzutu to macierz wykresu rozrzutu, która pozwala zrozumieć relację parami pomiędzy różnymi zmiennymi w zbiorze danych.
Istnieją dwa typowe sposoby tworzenia macierzy wykresów rozrzutu w R:
Metoda 1: Użyj podstawy R
#create scatterplot matrix (pch=20 means to use a solid circle for points) plot(df, pch= 20 )
Metoda 2: użyj pakietów ggplot2 i GGally
library (ggplot2) library (GGally) #create scatterplot matrix ggpairs(df)
Poniższe przykłady pokazują, jak w praktyce wykorzystać każdą metodę z następującą ramką danych w R:
#create data frame df <- data. frame (points=c(99, 90, 86, 88, 95, 99, 101, 104), assists=c(33, 28, 31, 39, 40, 40, 35, 47), rebounds=c(30, 28, 24, 24, 20, 20, 15, 12)) #view first few rows of data frame head(df) points assists rebounds 1 99 33 30 2 90 28 28 3 86 31 24 4 88 39 24 5 95 40 20 6 99 40 20
Przykład 1: Utwórz macierz wykresu rozrzutu przy użyciu podstawy R
Możemy użyć podstawowej funkcji R plot() do utworzenia macierzy wykresu rozrzutu dla każdej zmiennej w naszej ramce danych:
#create scatterplot matrix
plot(df, pch= 20 , cex= 1.5 , col=' steelblue ')
Sposób interpretacji macierzy jest następujący:
- Nazwy zmiennych są wyświetlane wzdłuż ukośnych ramek.
- Wszystkie pozostałe pola przedstawiają wykres rozrzutu zależności pomiędzy każdą parą kombinacji zmiennych. Przykładowo pole w prawym górnym rogu matrycy wyświetla wykres rozrzutu wartości punktów i zbiórek . Środkowy lewy obszar pokazuje wykres rozrzutu wartości punktów , asyst itp.
Zauważ, że cex kontroluje rozmiar punktów na ścieżce, a col kontroluje kolor punktów.
Przykład 2: Utwórz macierz wykresu rozrzutu za pomocą ggplot2 i GGally
Możemy również użyć funkcji ggpairs() z pakietów ggplot2 i GGally w R, aby utworzyć macierz wykresu rozrzutu dla każdej zmiennej w naszej ramce danych:
library (ggplot2) library (GGally) #create scatterplot matrix ggpairs(df)
Ta macierz wykresów rozrzutu zawiera te same wykresy rozrzutu, co funkcja bazowa R. plot() , ale dodatkowo możemy zobaczyć współczynnik korelacji pomiędzy każdą kombinacją zmiennych parami, a także wykres gęstości dla każdej indywidualnej zmiennej.
Na przykład możemy zobaczyć:
- Współczynnik korelacji pomiędzy asystami i punktami wynosi 0,571 .
- Współczynnik korelacji pomiędzy zbiórkami i punktami wynosi -0,598 .
- Współczynnik korelacji pomiędzy zbiórkami i asystami wynosi -0,740 .
Mała gwiazdka ( * ) obok -0,740 również wskazuje, że korelacja pomiędzy zbiórkami i asystami jest istotna statystycznie.
Dodatkowe zasoby
Poniższe samouczki wyjaśniają, jak wykonywać inne typowe zadania w języku R:
Jak utworzyć macierz korelacji w R
Jak tworzyć chmury punktów według grup w R