Cos'è sturges? governate? (definizione & #038; esempio)


Un istogramma è un grafico che ci aiuta a visualizzare la distribuzione dei valori in un insieme di dati.

Si scopre che il numero di riquadri utilizzati in un istogramma può avere un enorme impatto sul modo in cui interpretiamo i dati.

Se utilizziamo troppo pochi gruppi, il vero modello sottostante nei dati può essere nascosto:

E se utilizziamo troppi gruppi, possiamo semplicemente visualizzare il rumore in un set di dati:

Fortunatamente, possiamo utilizzare un metodo noto come regola di Sturges per determinare il numero ottimale di riquadri da utilizzare in un istogramma.

La regola di Sturges utilizza la seguente formula per determinare il numero ottimale di gruppi da utilizzare in un istogramma:

Bin ottimali = ⌈log 2 n + 1⌉

Oro:

  • n: il numero totale di osservazioni nel set di dati.
  • ⌈ ⌉: Simboli che significano “tetto”, ovvero arrotondano il risultato al numero intero più vicino.

Esempio: regola di Sturges

Supponiamo di avere il seguente set di dati con n = 31 osservazioni in totale:

Possiamo utilizzare la regola di Sturges per determinare il numero ottimale di caselle da utilizzare per visualizzare questi valori in un istogramma:

Contenitori ottimali = ⌈log 2 (31) + 1⌉ = ⌈4.954 + 1⌉ = ⌈5.954⌉ = 6 .

Secondo la regola di Sturges, dovremmo utilizzare 6 contenitori nell’istogramma che utilizziamo per visualizzare questa distribuzione di valori.

Ecco come apparirebbe un istogramma con 6 gruppi per questo set di dati:

Utilizzo della regola di Sturges per determinare il numero di riquadri da utilizzare in un istogramma

Si noti come questo sembri essere sufficiente per avere una buona idea della distribuzione sottostante dei valori senza essere troppo numerosi per visualizzare semplicemente il rumore nei dati.

Valori comuni per la regola di Sturges

La tabella seguente mostra il numero ottimale di gruppi da utilizzare in un istogramma in base al numero totale di osservazioni in un set di dati, secondo la regola di Sturges:

Regola di Sturges per diverse dimensioni del campione

Alternative alla regola di Sturges

La regola di Sturges è il metodo più comune per determinare il numero ottimale di contenitori da utilizzare in un istogramma, ma esistono diversi metodi alternativi, tra cui:

La regola della radice quadrata : numero di caselle = ⌈√ n

La regola del riso: numero di contenitori = ⌈2 * 3n

La regola di Freedman-Diaconis: Numero di caselle = (2*IQR) / 3n dove IQR è l’intervallo interquartile.

Bonus: calcolatore delle regole di Sturges

Utilizza questo calcolatore online gratuito per applicare automaticamente la regola di Sturges per determinare il numero ottimale di gruppi da utilizzare per un istogramma in base alla dimensione di un set di dati.

Aggiungi un commento

Il tuo indirizzo email non sarà pubblicato. I campi obbligatori sono contrassegnati *