Misure di dispersione

In questo articolo imparerai cosa sono le misure di dispersione e a cosa servono queste metriche statistiche. Inoltre, sarai in grado di vedere come viene calcolata ciascuna misura di dispersione.

Cosa sono le misure di dispersione?

Le misure di dispersione sono misure statistiche che indicano la dispersione di un set di dati. Cioè, le misure di dispersione vengono utilizzate per valutare il grado di dispersione dei dati in un campione.

Le misure di dispersione sono anche chiamate misure di variabilità o misure di spread .

Quali sono le misure di dispersione?

Le misure di dispersione sono le seguenti:

  • Deviazione standard (o deviazione standard)
  • Varianza
  • Coefficiente di variazione
  • Ordinato
  • Intervallo interquartile
  • Differenza media

Di seguito viene spiegato come determinare ciascuna misura di dispersione.

Deviazione standard

La deviazione standard , chiamata anche deviazione tipica , è uguale alla radice quadrata della somma dei quadrati delle deviazioni della serie di dati divisa per il numero totale di osservazioni.

La formula per questa misura di dispersione è quindi la seguente:

\displaystyle\sigma=\sqrt{\frac{\displaystyle\sum_{i=1}^N(x_i-\overline{x})^2}{N}}

Varianza

La varianza è uguale alla somma dei quadrati dei residui sul numero totale di osservazioni. La formula per questa metrica di dispersione è quindi la seguente:

Var(X)=\cfrac{\displaystyle\sum_{i=1}^n\left(x_i-\overline{x}\right)^2}{n}

Oro:

  • X

    è la variabile casuale di cui si vuole calcolare la varianza.

  • x_i

    è il valore dei dati

    i

    .

  • n

    è il numero totale di osservazioni.

  • \overline{X}

    è la media della variabile casuale

    X

    .

Coefficiente di variazione

In statistica, il coefficiente di variazione è una misura di dispersione utilizzata per determinare la dispersione di un insieme di dati rispetto alla sua media. Il coefficiente di variazione viene calcolato dividendo la deviazione standard dei dati per la sua media, quindi moltiplicando per 100 per esprimere il valore come percentuale.

CV=\cfrac{\sigma}{\overline{x}}\cdot 100

Ordinato

L’intervallo è una misura di dispersione che indica la differenza tra il valore massimo e minimo dei dati in un campione. Pertanto, per calcolare l’entità di una popolazione o di un campione statistico, è necessario sottrarre il valore massimo dal valore minimo.

R=\text{M\'ax}-\text{M\'in}

Intervallo interquartile

Lo scarto interquartile , chiamato anche scarto interquartile , è una misura di dispersione statistica che indica la differenza tra il terzo e il primo quartile.

Pertanto, per calcolare l’intervallo interquartile di un set di dati statistici, è necessario prima trovare il terzo e il primo quartile e poi sottrarli.

IQR=Q_3-Q_1

Il simbolo dell’intervallo interquartile è IQR, dall’intervallo interquartile inglese.

Una delle caratteristiche più vantaggiose di questa misura di dispersione è che si tratta di una statistica robusta, ovvero ha un’elevata robustezza rispetto ai valori anomali. Poiché i valori estremi non vengono presi in considerazione nel calcolo dell’intervallo interquartile, il suo valore varierà molto poco se compaiono nuovi valori anomali .

Differenza media

La deviazione media , chiamata anche deviazione media assoluta , è la media delle deviazioni assolute. La deviazione media è quindi pari alla somma delle deviazioni di ciascun dato dalla media aritmetica divisa per il numero totale di dati.

D_{\overline{x}}=\cfrac{\sum_{i=1}^N|x_i-\overline{x}|}{N}

A cosa servono le misurazioni della dispersione?

Le misure di dispersione vengono utilizzate per valutare la dispersione di un campione statistico. Cioè, le misure di dispersione ci permettono di quantificare la dispersione di un set di dati e, dai valori ottenuti, si può analizzare la dispersione del campione di dati.

Le misure di dispersione sono ampiamente utilizzate perché aiutano a descrivere un campione di dati. Le misure di dispersione aiutano a capire come appare una serie di dati.

Altre misure statistiche spesso calcolate sono le misure di tendenza centrale e le misure di posizione. In genere, non viene determinata una singola misurazione statistica, ma vengono effettuate piuttosto misurazioni multiple per comprendere meglio come appaiono i dati studiati.

Aggiungi un commento

Il tuo indirizzo email non sarà pubblicato. I campi obbligatori sono contrassegnati *