O que é sturges: governante? (definição e #038; exemplo)
Um histograma é um gráfico que nos ajuda a visualizar a distribuição de valores em um conjunto de dados.
Acontece que o número de caixas usadas em um histograma pode ter um enorme impacto na forma como interpretamos os dados.
Se usarmos poucos grupos, o verdadeiro padrão subjacente nos dados pode ficar oculto:
E se usarmos muitos grupos, podemos simplesmente visualizar o ruído em um conjunto de dados:
Felizmente, podemos usar um método conhecido como regra de Sturges para determinar o número ideal de caixas a serem usadas em um histograma.
A regra de Sturges usa a seguinte fórmula para determinar o número ideal de grupos a serem usados em um histograma:
Caixas ideais = ⌈log 2 n + 1⌉
Ouro:
- n: o número total de observações no conjunto de dados.
- ⌈ ⌉: Símbolos que significam “teto”, ou seja, arredondamento da resposta para o número inteiro mais próximo.
Exemplo: regra de Sturges
Suponha que temos o seguinte conjunto de dados com n = 31 observações no total:
Podemos usar a regra de Sturges para determinar o número ideal de caixas a serem usadas para visualizar esses valores em um histograma:
Bins ideais = ⌈log 2 (31) + 1⌉ = ⌈4,954 + 1⌉ = ⌈5,954⌉ = 6 .
De acordo com a regra de Sturges, devemos usar 6 compartimentos no histograma que usamos para visualizar esta distribuição de valores.
Esta é a aparência de um histograma com 6 grupos para este conjunto de dados:
Observe como isso parece ser suficiente para ter uma boa ideia da distribuição subjacente de valores sem ser muito numeroso para simplesmente visualizar o ruído nos dados.
Valores comuns para a regra de Sturges
A tabela a seguir mostra o número ideal de grupos a serem usados em um histograma com base no número total de observações em um conjunto de dados, de acordo com a regra de Sturges:
Alternativas à regra de Sturges
A regra de Sturges é o método mais comum para determinar o número ideal de compartimentos a serem usados em um histograma, mas existem vários métodos alternativos, incluindo:
A regra da raiz quadrada : Número de caixas = ⌈√ n ⌉
A regra do arroz: Número de caixas = ⌈2 * 3 √ n ⌉
A regra Freedman-Diaconis: Número de caixas = (2*IQR) / 3 √ n onde IQR é o intervalo interquartil.
Bônus: Calculadora de regras de Sturges
Use esta calculadora online gratuita para aplicar automaticamente a regra de Sturges para determinar o número ideal de grupos a serem usados para um histograma com base no tamanho de um conjunto de dados.