Gráfico de caixa e bigode

Este artigo explica o que é um boxplot, também conhecido como box plot (ou boxplot). Você descobrirá como são feitos esses tipos de diagramas estatísticos e um exercício resolvido de um diagrama de caixa e bigode e sua interpretação.

O que é um gráfico de caixa e bigode?

O boxplot , também chamado de boxplot ou boxplot , é um gráfico que representa visualmente um conjunto de dados estatísticos por meio de quartis.

A principal característica do box and whisker plot é que ele permite visualizar rapidamente a dispersão de uma série de dados, pois indica os quartis, a mediana, os valores extremos e os outliers dos dados.

Assim, este tipo de diagrama é composto por uma caixa retangular e algumas linhas (ou bigodes) das quais emergem os seguintes valores:

  • Os limites da caixa indicam o primeiro e terceiro quartis (Q 1 e Q 3 ). E a linha vertical dentro da caixa é a mediana (equivalente ao segundo quartil Q2 ).
  • Os limites dos bigodes (ou braços) são os valores extremos , ou seja, o valor mínimo e o valor máximo da série de dados.
  • Os pontos fora dos bigodes são outliers , ou seja, dados que provavelmente foram medidos incorretamente e, portanto, não devem ser levados em consideração no estudo estatístico.
boxplot ou boxplot

Observe que a diferença entre o terceiro e o primeiro quartil é o intervalo interquartil (ou intervalo interquartil), outra medida de dispersão estatística.

Os gráficos de caixa e bigode são muito úteis para comparar variáveis numéricas. No entanto, não é adequado para representar variáveis categóricas.

Como criar um gráfico de caixa e bigode

Para criar um box and whisker plot (ou boxplot) a partir de uma série de dados, as seguintes etapas devem ser executadas:

  1. Classifique os exemplos de dados estatísticos.
  2. Calcule os quartis (Q 1 , Q 2 e Q 3 ) e represente-os como a caixa no diagrama. O primeiro e o terceiro quartis correspondem aos limites da caixa, e para representar a mediana (o segundo quartil) deve-se traçar uma linha dentro da caixa onde está localizado o seu valor.
  3. Calcule o intervalo interquartil, que é igual ao terceiro quartil menos o primeiro quartil.
  4. IQR=Q_3-Q_1

  5. Calcule os valores admissíveis LI e LS, cujas fórmulas são:
  6. LI=Q_1-1,5\cdot IQR

    LS=Q_3+1,5\cdot IQR

  7. Identifique valores discrepantes da amostra, que são valores menores que LI ou maiores que LS. Represente esses valores fora da faixa de bigodes com pontos.
  8. Identifique e represente os valores extremos, que são o menor valor e o maior valor no intervalo formado por LI e LS. Esses valores representam o final dos dois bigodes no diagrama.

Exemplo de gráfico de caixa e bigode

Considerando a definição e teoria do box and whisker plot (ou boxplot), você encontrará a seguir um exemplo concreto para entender melhor o conceito e ver como esse tipo de gráfico estatístico é realizado.

  • Desenhe um boxplot do seguinte conjunto de dados estatísticos.

Neste caso, os dados já estão ordenados do menor para o maior, portanto nenhuma alteração é necessária. Caso contrário, devemos classificar os dados da amostra primeiro.

Em segundo lugar, extraímos os quartis da amostra:

Q_1=4,06

Q_2=4,38

Q_3=4,66

Depois de calcularmos os três quartis, encontramos o intervalo interquartil subtraindo o quartil 3 menos o quartil 1:

IQR=Q_3-Q_1=4,66-4,06=0,6

Calculamos agora os limites LI e LS, que são os valores a partir dos quais os dados são considerados atípicos. Para fazer isso, você deve usar as seguintes fórmulas:

LI=Q_1-1,5\cdot IQR=4,06-1,5\cdot 0,6=3,16

LS=Q_3+1,5\cdot IQR=4,66+1,5\cdot 0,6=5,56

Portanto, neste caso temos dois valores discrepantes, porque 3,02 é menor que 3,16 e 5,71 é maior que 5,56.

\text{Valores at\'ipicos} =\Bigl\{3,02 \ ; \ 5,71\Bigr\}

Por fim, resta identificar os valores extremos, que são o mínimo e o máximo de todos os dados que estão no intervalo [LI,LS]. Portanto, no nosso exemplo, o valor mínimo é 3,70 e o valor máximo é 4,81.

\text{M\'inimo}=3,70

\text{M\'aximo}=4,81

Assim, uma vez identificados todos os valores da caixa e do bigode, resta fazer a representação gráfica:

exemplo de boxplot

Para que serve um gráfico de caixa e bigode?

Por fim, vamos ver para que serve e como interpretar o box and whisker plot (ou boxplot).

Obviamente, o box and whisker plot é muito útil para conhecer rapidamente os quartis, intervalo interquartil, mediana, valores extremos e outliers de uma série de dados, já que todas essas medidas estatísticas podem ser identificadas com uma simples visualização.

Além disso, o box and whisker plot é utilizado para analisar a simetria da amostra estatística, pois representa visualmente todo o conjunto de dados. Se a mediana não estiver no centro da caixa, significa que a amostra não é simétrica.

Da mesma forma, os boxplots são muito utilizados no mercado de ações para representar a variação do preço de uma ação ao longo de um período de tempo, pois permitem visualizar o valor máximo, o valor mínimo e os valores intermediários em um curto período de tempo. tempo e assim tomar decisões mais rápidas.

Add a Comment

O seu endereço de email não será publicado. Campos obrigatórios marcados com *