Como criar um boxplot agrupado em r usando ggplot2
Boxplots são úteis para visualizar o resumo de cinco dígitos de um conjunto de dados, que inclui:
- Mínimo
- O primeiro quartil
- A mediana
- O terceiro quartil
- O máximo
Relacionado: Uma introdução suave aos boxplots
Felizmente, é fácil criar boxplots em R usando a biblioteca de visualização ggplot2 .
Também envolve a criação de boxplots agrupados por uma variável específica em um conjunto de dados. Por exemplo, suponha que temos o seguinte conjunto de dados que exibe o aumento de eficiência de 150 jogadores de basquete de três times diferentes com base em dois programas de treinamento diferentes:
#define variables team=rep(c('A', 'B', 'C'), each =50) program=rep(c('low', 'high'), each =25) increase=seq(1:150)+sample(1:100, 100, replace= TRUE ) #create dataset using variables data=data.frame(team, program, increase) #view first six rows of dataset head(data) team program increase 1 A low 62 2 A low 37 3 A low 49 4 A low 60 5 A low 64 6 A low 105
Podemos usar o código a seguir para criar boxplots que exibem o aumento na eficiência dos jogadores, agrupados por equipe e preenchidos com base na programação de treinamento:
library (ggplot2) ggplot(data, aes(x=team, y=increase, fill=program)) + geom_boxplot ()
Podemos usar sintaxe semelhante para criar boxplots que exibem o aumento na eficiência dos jogadores, agrupados por programa de treinamento e preenchidos por equipe:
library (ggplot2) ggplot(data, aes(x=program, y=increase, fill=team)) + geom_boxplot ()
Uma alternativa semelhante é usar facetação , em que cada subgrupo é exibido em seu próprio painel:
library (ggplot2) ggplot(data, aes(x=team, y=increase, fill=program)) + geom_boxplot () + facet_wrap (~program)
Dependendo dos dados com os quais você está trabalhando, a criação de facetas pode ou não atender às suas necessidades de visualização.
Recursos adicionais
Como remover outliers em boxplots em R
Como criar gráficos lado a lado no ggplot2
Um guia completo para os melhores temas ggplot2