O que é sturges: governante? (definição e #038; exemplo)


Um histograma é um gráfico que nos ajuda a visualizar a distribuição de valores em um conjunto de dados.

Acontece que o número de caixas usadas em um histograma pode ter um enorme impacto na forma como interpretamos os dados.

Se usarmos poucos grupos, o verdadeiro padrão subjacente nos dados pode ficar oculto:

E se usarmos muitos grupos, podemos simplesmente visualizar o ruído em um conjunto de dados:

Felizmente, podemos usar um método conhecido como regra de Sturges para determinar o número ideal de caixas a serem usadas em um histograma.

A regra de Sturges usa a seguinte fórmula para determinar o número ideal de grupos a serem usados em um histograma:

Caixas ideais = ⌈log 2 n + 1⌉

Ouro:

  • n: o número total de observações no conjunto de dados.
  • ⌈ ⌉: Símbolos que significam “teto”, ou seja, arredondamento da resposta para o número inteiro mais próximo.

Exemplo: regra de Sturges

Suponha que temos o seguinte conjunto de dados com n = 31 observações no total:

Podemos usar a regra de Sturges para determinar o número ideal de caixas a serem usadas para visualizar esses valores em um histograma:

Bins ideais = ⌈log 2 (31) + 1⌉ = ⌈4,954 + 1⌉ = ⌈5,954⌉ = 6 .

De acordo com a regra de Sturges, devemos usar 6 compartimentos no histograma que usamos para visualizar esta distribuição de valores.

Esta é a aparência de um histograma com 6 grupos para este conjunto de dados:

Usando a regra de Sturges para determinar o número de caixas a serem usadas em um histograma

Observe como isso parece ser suficiente para ter uma boa ideia da distribuição subjacente de valores sem ser muito numeroso para simplesmente visualizar o ruído nos dados.

Valores comuns para a regra de Sturges

A tabela a seguir mostra o número ideal de grupos a serem usados em um histograma com base no número total de observações em um conjunto de dados, de acordo com a regra de Sturges:

Regra de Sturges para diferentes tamanhos de amostra

Alternativas à regra de Sturges

A regra de Sturges é o método mais comum para determinar o número ideal de compartimentos a serem usados em um histograma, mas existem vários métodos alternativos, incluindo:

A regra da raiz quadrada : Número de caixas = ⌈√ n

A regra do arroz: Número de caixas = ⌈2 * 3n

A regra Freedman-Diaconis: Número de caixas = (2*IQR) / 3n onde IQR é o intervalo interquartil.

Bônus: Calculadora de regras de Sturges

Use esta calculadora online gratuita para aplicar automaticamente a regra de Sturges para determinar o número ideal de grupos a serem usados para um histograma com base no tamanho de um conjunto de dados.

Add a Comment

O seu endereço de email não será publicado. Campos obrigatórios marcados com *