Jak utworzyć macierz wykresu rozrzutu w r (2 przykłady)


Macierz wykresu rozrzutu to macierz wykresu rozrzutu, która pozwala zrozumieć relację parami pomiędzy różnymi zmiennymi w zbiorze danych.

Istnieją dwa typowe sposoby tworzenia macierzy wykresów rozrzutu w R:

Metoda 1: Użyj podstawy R

 #create scatterplot matrix (pch=20 means to use a solid circle for points)
plot(df, pch= 20 )

Metoda 2: użyj pakietów ggplot2 i GGally

 library (ggplot2)
library (GGally)

#create scatterplot matrix
ggpairs(df)

Poniższe przykłady pokazują, jak w praktyce wykorzystać każdą metodę z następującą ramką danych w R:

 #create data frame
df <- data. frame (points=c(99, 90, 86, 88, 95, 99, 101, 104),
                 assists=c(33, 28, 31, 39, 40, 40, 35, 47),
                 rebounds=c(30, 28, 24, 24, 20, 20, 15, 12))

#view first few rows of data frame
head(df)

  points assists rebounds
1 99 33 30
2 90 28 28
3 86 31 24
4 88 39 24
5 95 40 20
6 99 40 20

Przykład 1: Utwórz macierz wykresu rozrzutu przy użyciu podstawy R

Możemy użyć podstawowej funkcji R plot() do utworzenia macierzy wykresu rozrzutu dla każdej zmiennej w naszej ramce danych:

 #create scatterplot matrix
plot(df, pch= 20 , cex= 1.5 , col=' steelblue ')

macierz wykresu rozrzutu w R

Sposób interpretacji macierzy jest następujący:

  • Nazwy zmiennych są wyświetlane wzdłuż ukośnych ramek.
  • Wszystkie pozostałe pola przedstawiają wykres rozrzutu zależności pomiędzy każdą parą kombinacji zmiennych. Przykładowo pole w prawym górnym rogu matrycy wyświetla wykres rozrzutu wartości punktów i zbiórek . Środkowy lewy obszar pokazuje wykres rozrzutu wartości punktów , asyst itp.

Zauważ, że cex kontroluje rozmiar punktów na ścieżce, a col kontroluje kolor punktów.

Przykład 2: Utwórz macierz wykresu rozrzutu za pomocą ggplot2 i GGally

Możemy również użyć funkcji ggpairs() z pakietów ggplot2 i GGally w R, aby utworzyć macierz wykresu rozrzutu dla każdej zmiennej w naszej ramce danych:

 library (ggplot2)
library (GGally)

#create scatterplot matrix
ggpairs(df) 

macierz wykresu rozrzutu w ggplot2

Ta macierz wykresów rozrzutu zawiera te same wykresy rozrzutu, co funkcja bazowa R. plot() , ale dodatkowo możemy zobaczyć współczynnik korelacji pomiędzy każdą kombinacją zmiennych parami, a także wykres gęstości dla każdej indywidualnej zmiennej.

Na przykład możemy zobaczyć:

  • Współczynnik korelacji pomiędzy asystami i punktami wynosi 0,571 .
  • Współczynnik korelacji pomiędzy zbiórkami i punktami wynosi -0,598 .
  • Współczynnik korelacji pomiędzy zbiórkami i asystami wynosi -0,740 .

Mała gwiazdka ( * ) obok -0,740 również wskazuje, że korelacja pomiędzy zbiórkami i asystami jest istotna statystycznie.

Dodatkowe zasoby

Poniższe samouczki wyjaśniają, jak wykonywać inne typowe zadania w języku R:

Jak utworzyć macierz korelacji w R
Jak tworzyć chmury punktów według grup w R

Dodaj komentarz

Twój adres e-mail nie zostanie opublikowany. Wymagane pola są oznaczone *