Dati raggruppati

Questo articolo spiega cosa sono i dati raggruppati e come vengono raggruppati. Inoltre troverai un esercizio risolto in cui i dati sono raggruppati per intervalli.

Cosa sono i dati raggruppati?

Nelle statistiche, i dati raggruppati sono dati raggruppati in intervalli. In altre parole, i dati raggruppati sono dati raccolti a intervalli regolari in modo che possano essere studiati insieme.

Pertanto, quando si raggruppa un insieme di dati statistici, questi vengono separati in intervalli diversi, in modo che ciascun dato possa appartenere a un solo intervallo.

In breve, in statistica, il clustering dei dati consente di analizzare più dati congiuntamente, in modo che i dati raggruppati all’interno di un intervallo vengano trattati come un unico dato. Inoltre, il raggruppamento dei dati è molto utile quando il campione è molto ampio.

Esempio di dati raggruppati

Osservando la definizione di dati raggruppati, di seguito è riportato un esempio concreto di come un insieme di dati viene raggruppato in intervalli diversi.

  • È stata misurata la dimensione del campione di 50 persone diverse e tutti i valori sono stati registrati nella seguente tabella di dati. Raggruppare il set di dati in intervalli, quindi rappresentare graficamente i dati.

Innanzitutto, dobbiamo separare i dati in intervalli. Esistono molti metodi a questo scopo, ma la regola di Sturges è la più utilizzata, perché consente di calcolare il numero ideale di intervalli:

\begin{array}{l}c=1+\log_2(N)\\[2ex]c=1+\log_2(50)\\[2ex]c=1+5,64\\[2ex]c=6,64\\[2ex]c\approx 7\end{array}

Quindi dobbiamo separare i dati in sette intervalli diversi. Dobbiamo ora conoscere l’ampiezza che ciascun intervallo deve avere. Per fare ciò, dividi semplicemente il valore massimo meno il valore minimo per il numero totale di intervalli:

a=\cfrac{\text{valor m\'aximo}-\text{valor m\'inimo}}{c}=\cfrac{205-145}{7}=8,57\approx 9

In breve devono esserci 7 intervalli di ampiezza 9, quindi gli intervalli calcolati secondo la regola di Sturges sono i seguenti:

[145,154)

[154,163)

[163,172)

[172,181)

[181,190)

[190,199)

[199,208)

E una volta calcolati gli intervalli, contiamo il numero di volte in cui un dato appare in ciascun intervallo e costruiamo una tabella con i dati raggruppati:

Tieni presente che è possibile calcolare ancora più tipi di frequenza dai dati raggruppati (frequenza relativa, frequenza cumulativa, ecc.). Per vedere come creare una tabella di frequenza completa con dati raggruppati, fai clic qui:

Infine, dalla tabella con la frequenza di ciascun intervallo, possiamo rappresentare graficamente i dati raggruppati in un istogramma.

Istogramma della regola di Sturges, statistiche

Dati raggruppati e separati

I dati non raggruppati sono dati che non sono separati in intervalli, ma ogni valore viene studiato separatamente.

Seguendo l’esempio sopra elaborato, se non avessimo raggruppato i dati, avremmo dovuto trovare la frequenza di ciascun valore. Cioè avremmo dovuto calcolare quante volte il valore 158, 165, 174, ecc. viene ripetuto. Tuttavia in questo caso era meglio raggruppare i dati per intervalli perché avevamo una grande quantità di dati e, inoltre, molti valori erano simili.

Pertanto, durante uno studio statistico, prima di effettuare i calcoli, è importante decidere se i dati devono essere raggruppati per intervalli oppure no, poiché questo condizionerà il resto dell’indagine.

Quando dovrebbero essere consolidati i dati?

In generale, i dati dovrebbero essere raggruppati in intervalli quando la variabile è continua. Se la variabile è continua, normalmente abbiamo molti valori e sono molto vicini tra loro, quindi possono essere raggruppati in intervalli per semplificare lo studio.

Logicamente, anche se la variabile non è continua, se abbiamo molti dati, può anche essere raggruppata in intervalli, rendendo più semplice l’analisi statistica. Ma generalmente il criterio per raggruppare i dati è il tipo di variabile: se la variabile è continua, i dati vengono generalmente separati in intervalli.

Aggiungi un commento

Il tuo indirizzo email non sarà pubblicato. I campi obbligatori sono contrassegnati *