Como identificar assimetria em box plots


Um box plot é um tipo de gráfico que exibe o resumo de cinco dígitos de um conjunto de dados, que inclui:

  • O valor mínimo
  • O primeiro quartil (o 25º percentil)
  • O valor mediano
  • O terceiro quartil (o 75º percentil)
  • O valor máximo

Usamos o seguinte processo para desenhar um box plot:

  • Desenhe uma caixa do primeiro quartil (Q1) ao terceiro quartil (Q3)
  • Em seguida, desenhe uma linha dentro da caixa na mediana
  • Em seguida, desenhe “bigodes” dos quartis até os valores mínimo e máximo.

Podemos determinar se uma distribuição está distorcida ou não com base em onde o valor mediano está no boxplot.

Assimetria do box plot

Quando a mediana está mais próxima da parte inferior da caixa e o bigode é mais curto na extremidade inferior da caixa, a distribuição é distorcida para a direita (ou distorcida “positivamente”).

Quando a mediana está mais próxima do topo da caixa e o bigode é mais curto na extremidade superior da caixa, a distribuição fica distorcida (ou distorcida “negativamente”).

Quando a mediana está no meio da caixa e os bigodes são aproximadamente iguais em ambos os lados, a distribuição é simétrica (ou “não” assimétrica).

Os exemplos a seguir ilustram como usar boxplots para determinar se uma distribuição é assimétrica à direita, assimétrica à esquerda ou não tem distorção.

Exemplo 1: Distribuição enviesada à direita

A distribuição da renda familiar anual nos Estados Unidos é distorcida para a direita. A maioria das famílias ganha entre US$ 40.000 e US$ 80.000 por ano, mas há uma longa cauda à direita na distribuição que representa as famílias que ganham muito mais.

Se criássemos um box plot para visualizar a distribuição da renda familiar, ficaria assim:

Observe que a linha vertical dentro da caixa que representa a mediana está muito mais próxima do primeiro quartil do que do terceiro quartil, o que significa que a distribuição está distorcida para a direita.

Exemplo 2: distribuição enviesada à esquerda

A distribuição etária das mortes na maioria das populações é distorcida para a esquerda. A maioria das pessoas vive entre 70 e 80 anos e cada vez menos pessoas vivem abaixo desta idade.

Se criássemos um box plot para visualizar a distribuição etária das mortes, ficaria assim:

Observe que a linha vertical dentro da caixa que representa a mediana está muito mais próxima do terceiro quartil do que do primeiro quartil, o que significa que a distribuição está distorcida para a esquerda.

Exemplo 3: distribuição simétrica

A distribuição de tamanho dos machos é aproximadamente simétrica e não apresenta assimetria. Por exemplo, a altura média de um homem nos Estados Unidos é de aproximadamente 69,1 polegadas. A distribuição de altura é aproximadamente simétrica, sendo alguns mais baixos e outros mais altos.

Se criássemos um box plot para visualizar a distribuição da altura masculina nos Estados Unidos, ficaria assim:

Observe que a linha vertical dentro da caixa que representa a mediana também está próxima do primeiro quartil e do terceiro quartil, o que significa que a distribuição é simétrica e sem assimetria.

Recursos adicionais

Distribuições distorcidas para a esquerda ou para a direita
Como comparar gráficos de caixa: com exemplos
Como criar gráficos de caixa lado a lado no Excel

Add a Comment

O seu endereço de email não será publicado. Campos obrigatórios marcados com *