Como identificar assimetria em box plots
Um box plot é um tipo de gráfico que exibe o resumo de cinco dígitos de um conjunto de dados, que inclui:
- O valor mínimo
- O primeiro quartil (o 25º percentil)
- O valor mediano
- O terceiro quartil (o 75º percentil)
- O valor máximo
Usamos o seguinte processo para desenhar um box plot:
- Desenhe uma caixa do primeiro quartil (Q1) ao terceiro quartil (Q3)
- Em seguida, desenhe uma linha dentro da caixa na mediana
- Em seguida, desenhe “bigodes” dos quartis até os valores mínimo e máximo.
Podemos determinar se uma distribuição está distorcida ou não com base em onde o valor mediano está no boxplot.
Quando a mediana está mais próxima da parte inferior da caixa e o bigode é mais curto na extremidade inferior da caixa, a distribuição é distorcida para a direita (ou distorcida “positivamente”).
Quando a mediana está mais próxima do topo da caixa e o bigode é mais curto na extremidade superior da caixa, a distribuição fica distorcida (ou distorcida “negativamente”).
Quando a mediana está no meio da caixa e os bigodes são aproximadamente iguais em ambos os lados, a distribuição é simétrica (ou “não” assimétrica).
Os exemplos a seguir ilustram como usar boxplots para determinar se uma distribuição é assimétrica à direita, assimétrica à esquerda ou não tem distorção.
Exemplo 1: Distribuição enviesada à direita
A distribuição da renda familiar anual nos Estados Unidos é distorcida para a direita. A maioria das famílias ganha entre US$ 40.000 e US$ 80.000 por ano, mas há uma longa cauda à direita na distribuição que representa as famílias que ganham muito mais.
Se criássemos um box plot para visualizar a distribuição da renda familiar, ficaria assim:
Observe que a linha vertical dentro da caixa que representa a mediana está muito mais próxima do primeiro quartil do que do terceiro quartil, o que significa que a distribuição está distorcida para a direita.
Exemplo 2: distribuição enviesada à esquerda
A distribuição etária das mortes na maioria das populações é distorcida para a esquerda. A maioria das pessoas vive entre 70 e 80 anos e cada vez menos pessoas vivem abaixo desta idade.
Se criássemos um box plot para visualizar a distribuição etária das mortes, ficaria assim:
Observe que a linha vertical dentro da caixa que representa a mediana está muito mais próxima do terceiro quartil do que do primeiro quartil, o que significa que a distribuição está distorcida para a esquerda.
Exemplo 3: distribuição simétrica
A distribuição de tamanho dos machos é aproximadamente simétrica e não apresenta assimetria. Por exemplo, a altura média de um homem nos Estados Unidos é de aproximadamente 69,1 polegadas. A distribuição de altura é aproximadamente simétrica, sendo alguns mais baixos e outros mais altos.
Se criássemos um box plot para visualizar a distribuição da altura masculina nos Estados Unidos, ficaria assim:
Observe que a linha vertical dentro da caixa que representa a mediana também está próxima do primeiro quartil e do terceiro quartil, o que significa que a distribuição é simétrica e sem assimetria.
Recursos adicionais
Distribuições distorcidas para a esquerda ou para a direita
Como comparar gráficos de caixa: com exemplos
Como criar gráficos de caixa lado a lado no Excel