Como criar uma matriz de gráfico de dispersão em r (2 exemplos)


Uma matriz de gráfico de dispersão é uma matriz de gráfico de dispersão que permite compreender a relação de pares entre diferentes variáveis em um conjunto de dados.

Existem duas maneiras comuns de criar uma matriz de gráfico de dispersão em R:

Método 1: Use Base R

 #create scatterplot matrix (pch=20 means to use a solid circle for points)
plot(df, pch= 20 )

Método 2: use pacotes ggplot2 e GGally

 library (ggplot2)
library (GGally)

#create scatterplot matrix
ggpairs(df)

Os exemplos a seguir mostram como usar cada método na prática com o seguinte quadro de dados em R:

 #create data frame
df <- data. frame (points=c(99, 90, 86, 88, 95, 99, 101, 104),
                 assists=c(33, 28, 31, 39, 40, 40, 35, 47),
                 rebounds=c(30, 28, 24, 24, 20, 20, 15, 12))

#view first few rows of data frame
head(df)

  points assists rebounds
1 99 33 30
2 90 28 28
3 86 31 24
4 88 39 24
5 95 40 20
6 99 40 20

Exemplo 1: Crie uma matriz de gráfico de dispersão usando Base R

Podemos usar a função base R plot() para criar uma matriz de gráfico de dispersão para cada variável em nosso quadro de dados:

 #create scatterplot matrix
plot(df, pch= 20 , cex= 1.5 , col=' steelblue ')

matriz de gráfico de dispersão em R

A forma de interpretar a matriz é a seguinte:

  • Os nomes das variáveis são exibidos ao longo das caixas diagonais.
  • Todas as outras caixas exibem um gráfico de dispersão da relação entre cada combinação de variáveis aos pares. Por exemplo, a caixa no canto superior direito da matriz exibe um gráfico de dispersão de valores de pontos e rebotes . A área central esquerda mostra um gráfico de dispersão de valores para pontos e assistências , etc.

Observe que cex controla o tamanho dos pontos no caminho e col controla a cor dos pontos.

Exemplo 2: Crie uma matriz de gráfico de dispersão usando ggplot2 e GGally

Também podemos usar a função ggpairs() dos pacotes ggplot2 e GGally em R para criar uma matriz de gráfico de dispersão para cada variável em nosso quadro de dados:

 library (ggplot2)
library (GGally)

#create scatterplot matrix
ggpairs(df) 

matriz de gráfico de dispersão em ggplot2

Esta matriz de gráfico de dispersão contém os mesmos gráficos de dispersão da função R base plot() , mas além disso também podemos ver o coeficiente de correlação entre cada combinação de variáveis em pares, bem como um gráfico de densidade para cada variável individual.

Por exemplo, podemos ver:

  • O coeficiente de correlação entre assistências e pontos é de 0,571 .
  • O coeficiente de correlação entre rebotes e pontos é -0,598 .
  • O coeficiente de correlação entre rebotes e assistências é -0,740 .

A pequena estrela ( * ) próxima a -0,740 também indica que a correlação entre rebotes e assistências é estatisticamente significativa.

Recursos adicionais

Os tutoriais a seguir explicam como realizar outras tarefas comuns em R:

Como criar uma matriz de correlação em R
Como criar nuvens de pontos por grupo em R

Add a Comment

O seu endereço de email não será publicado. Campos obrigatórios marcados com *