Numero di classi (statistiche)

Questo articolo spiega come trovare il numero di classi nelle statistiche. Scoprirai anche come viene calcolata l’ampiezza degli intervalli dopo aver trovato il numero di classi e, inoltre, potrai vedere diversi esempi concreti.

Come calcolare il numero di classi nelle statistiche

Principalmente, in statistica, esistono due metodi per calcolare il numero ideale di classi per un campione di dati: la regola di Sturges, che è una formula, e il metodo della radice, che consiste nel trovare la radice quadrata del numero totale di dati.

A seconda del campione, è consigliabile utilizzare un metodo o un altro. Entrambi i metodi sono spiegati di seguito con un esempio.

La regola di Sturges

La regola di Sturges è una regola utilizzata per calcolare il numero ideale di classi o intervalli in cui dividere un set di dati. Nello specifico, la formula della regola di Sturges afferma che il numero appropriato di classi è uguale a uno più il logaritmo in base due del numero totale di punti dati.

c=1+\log_2(N)

Oro

c

è il numero di classi o intervalli e

N

è il numero totale di osservazioni nel campione.

La maggior parte dei calcolatori consente solo calcoli con logaritmi in base 10. In questo caso, puoi utilizzare questa formula equivalente:

c=1+\cfrac{\log(N)}{\log(2)}

Ad esempio, se abbiamo un campione statistico di 100 osservazioni, secondo la regola di Sturges, il numero di classi con cui raggruppare i dati si calcola come segue:

\begin{array}{l}c=1+\log_2(N)\\[2ex]c=1+\log_2(100)\\[2ex]c=1+6,64\\[2ex]c=7,64\\[2ex]c\approx 8\end{array}

Pertanto, per un campione con un totale di 100 punti dati, i dati devono essere divisi in 8 intervalli diversi.

metodo della radice

Sebbene la regola di Sturges sia sicuramente più conosciuta, un altro metodo ampiamente utilizzato in statistica per calcolare il numero di classi è quello di calcolare la radice quadrata della dimensione del campione.

Quindi, un’altra formula per calcolare il numero ideale di classi è la seguente:

c=\sqrt{N}

Oro

c

è il numero di classi o intervalli e

N

è il numero totale di elementi di dati nel campione.

Ad esempio, se abbiamo un totale di 150 dati, il calcolo del numero di intervalli in cui dobbiamo dividere i dati sarebbe:

c=\sqrt{150}=12,25 \approx 12

La formula precedente viene utilizzata quando la dimensione del campione è inferiore a 200, ma quando abbiamo 200 o più dati è meglio calcolare il numero di classi prendendo la radice cubica:

c=\sqrt[3]{N}

Oro

c

è il numero di classi o intervalli e

N

è il numero totale di elementi di dati nel campione.

Numero di classi e larghezza dell’intervallo

Una volta calcolato il numero di contenitori, possiamo calcolare l’ampiezza di ciascun intervallo utilizzando la seguente formula:

 \text{Amplitud de intervalo}=\cfrac{\text{Rango}}{\text{N\'umero de clases}}

Ad esempio, di seguito viene risolto un esercizio in modo da poter vedere come viene calcolata la larghezza degli intervalli.

  • Sono stati registrati i seguenti dati statistici. Calcola il numero di classi con la regola di Sturges, quindi determina la larghezza di ciascun intervallo.

35\ 18\ 25\ 2\ 45\ 34\ 68\ 42\ 9\ 41\ 62\ 85\ 53

21\ 4\ 86\ 50\ 32\ 71\ 59\ 29\ 12\ 38\ 91\ 63\ 7

67\ 37\ 23\ 70\ 65\ 47\ 76\ 83\ 54\ 27\ 25\ 19\ 98

Come abbiamo visto sopra, per determinare il numero di classi in cui raggruppare i dati applichiamo la regola di Sturges. In questo caso abbiamo 39 dati, quindi nella formula dobbiamo sostituire il parametro N con 39:

\begin{array}{l}c=1+\log_2(N)\\[2ex]c=1+\log_2(39)\\[2ex]c=1+5,28\\[2ex]c=6,28\\[2ex]c\approx 6\end{array}

Ora che conosciamo il numero appropriato di classi, calcoliamo la larghezza di ciascuna classe. Per fare ciò, dobbiamo prima calcolare l’intervallo dei dati del campione:

R=98-2=96

E una volta conosciuta l’entità del campione, dividiamo il valore trovato per il numero di classi calcolate in precedenza (6):

\text{Amplitud de intervalo}=\cfrac{96}{6}=16

La larghezza di tutte le classi deve quindi essere di 16 unità. Pertanto le classi che potremmo ottenere sono:

\begin{array}{l}[2,18)\\[2ex][18,34)\\[2ex][34,50)\\[2ex][50,66)\\[2ex][66,82)\\[2ex][82,98]\end{array}

Numero di classi in una distribuzione di frequenza

Infine è da notare che il calcolo del numero di classi è importante quando si effettua una distribuzione di frequenze (o tabella di frequenze), in questo modo è possibile separare velocemente i dati in diversi intervalli e quindi trovare tutti i tipi di frequenze di ciascun intervallo. .

Nel caso in cui non sai di cosa si tratta, una distribuzione di frequenza è una tabella che elenca tutti i tipi di frequenza per ciascun intervallo. Quindi ogni riga è una classe diversa e ogni colonna ha un tipo di frequenza diverso.

Per vedere un esempio di distribuzione di frequenza con dati raggruppati, fare clic sul seguente collegamento:

Aggiungi un commento

Il tuo indirizzo email non sarà pubblicato. I campi obbligatori sono contrassegnati *