Como criar uma matriz de gráfico de dispersão em r (2 exemplos)
Uma matriz de gráfico de dispersão é uma matriz de gráfico de dispersão que permite compreender a relação de pares entre diferentes variáveis em um conjunto de dados.
Existem duas maneiras comuns de criar uma matriz de gráfico de dispersão em R:
Método 1: Use Base R
#create scatterplot matrix (pch=20 means to use a solid circle for points) plot(df, pch= 20 )
Método 2: use pacotes ggplot2 e GGally
library (ggplot2) library (GGally) #create scatterplot matrix ggpairs(df)
Os exemplos a seguir mostram como usar cada método na prática com o seguinte quadro de dados em R:
#create data frame df <- data. frame (points=c(99, 90, 86, 88, 95, 99, 101, 104), assists=c(33, 28, 31, 39, 40, 40, 35, 47), rebounds=c(30, 28, 24, 24, 20, 20, 15, 12)) #view first few rows of data frame head(df) points assists rebounds 1 99 33 30 2 90 28 28 3 86 31 24 4 88 39 24 5 95 40 20 6 99 40 20
Exemplo 1: Crie uma matriz de gráfico de dispersão usando Base R
Podemos usar a função base R plot() para criar uma matriz de gráfico de dispersão para cada variável em nosso quadro de dados:
#create scatterplot matrix
plot(df, pch= 20 , cex= 1.5 , col=' steelblue ')
A forma de interpretar a matriz é a seguinte:
- Os nomes das variáveis são exibidos ao longo das caixas diagonais.
- Todas as outras caixas exibem um gráfico de dispersão da relação entre cada combinação de variáveis aos pares. Por exemplo, a caixa no canto superior direito da matriz exibe um gráfico de dispersão de valores de pontos e rebotes . A área central esquerda mostra um gráfico de dispersão de valores para pontos e assistências , etc.
Observe que cex controla o tamanho dos pontos no caminho e col controla a cor dos pontos.
Exemplo 2: Crie uma matriz de gráfico de dispersão usando ggplot2 e GGally
Também podemos usar a função ggpairs() dos pacotes ggplot2 e GGally em R para criar uma matriz de gráfico de dispersão para cada variável em nosso quadro de dados:
library (ggplot2) library (GGally) #create scatterplot matrix ggpairs(df)
Esta matriz de gráfico de dispersão contém os mesmos gráficos de dispersão da função R base plot() , mas além disso também podemos ver o coeficiente de correlação entre cada combinação de variáveis em pares, bem como um gráfico de densidade para cada variável individual.
Por exemplo, podemos ver:
- O coeficiente de correlação entre assistências e pontos é de 0,571 .
- O coeficiente de correlação entre rebotes e pontos é -0,598 .
- O coeficiente de correlação entre rebotes e assistências é -0,740 .
A pequena estrela ( * ) próxima a -0,740 também indica que a correlação entre rebotes e assistências é estatisticamente significativa.
Recursos adicionais
Os tutoriais a seguir explicam como realizar outras tarefas comuns em R:
Como criar uma matriz de correlação em R
Como criar nuvens de pontos por grupo em R