Como estimar o desvio padrão de qualquer histograma
Um histograma fornece uma maneira útil de visualizar a distribuição de valores em um conjunto de dados.
O eixo x de um histograma exibe grupos de valores de dados e o eixo y nos informa quantas observações em um conjunto de dados estão em cada grupo.
Como um histograma coloca as observações em compartimentos, não é possível calcular o desvio padrão exato do conjunto de dados representado pelo histograma, mas é possível estimar o desvio padrão.
O exemplo a seguir mostra como fazer isso.
Relacionado: Como estimar a média e a mediana de qualquer histograma
Como estimar o desvio padrão de um histograma
Para estimar o desvio padrão de um histograma, primeiro você deve estimar a média.
Podemos usar a seguinte fórmula para estimar a média:
Média: Σm i n i / N
Ouro:
- m i : O meio do i- ésimo compartimento
- n i : A frequência do i- ésimo compartimento
- N: O tamanho total da amostra
Por exemplo, suponha que temos o seguinte histograma:
Veja como estimar o valor médio deste histograma:
Estimamos a média em 22,89 .
Nota: O ponto médio de cada grupo pode ser encontrado calculando a média dos valores inferior e superior do intervalo. Por exemplo, o ponto médio do primeiro grupo é calculado da seguinte forma: (1+10) / 2 = 5,5.
Agora que temos uma estimativa da média, podemos usar a seguinte fórmula para estimar o desvio padrão:
Desvio padrão: √ Σn i (m i -μ) 2 / (N-1)
Ouro:
- n i : A frequência do i- ésimo compartimento
- m i : O meio do i- ésimo compartimento
- μ : A média
- N: O tamanho total da amostra
Veja como aplicaríamos esta fórmula ao nosso conjunto de dados:
Estimamos que o desvio padrão do conjunto de dados seja 9,6377 .
Embora não seja garantido que corresponda exatamente ao desvio padrão do conjunto de dados (uma vez que não conhecemos os valores dos dados brutos do conjunto de dados), ele representa nossa melhor estimativa do desvio padrão.
Recursos adicionais
Os tutoriais a seguir explicam como realizar outras tarefas comuns relacionadas a dados agrupados em grupos:
Como encontrar a variação de dados agrupados
Como encontrar a mediana de dados agrupados
Como encontrar o modo de dados agrupados