Perché l'intervallo è importante nelle statistiche?


Nelle statistiche, l’intervallo rappresenta la differenza tra il valore più piccolo e quello più grande in un insieme di dati.

Ad esempio, supponiamo di avere il seguente set di dati:

Set di dati: 3, 4, 11, 15, 19, 19, 19, 22, 22, 23, 23, 26

Possiamo usare la seguente formula per calcolare l’intervallo:

  • Intervallo = Valore massimo – Valore minimo
  • Intervallo = 26 – 3
  • Intervallo = 23

L’intervallo è 23 . Questo rappresenta la differenza tra i valori più piccoli e quelli più grandi nel set di dati.

Nelle statistiche, l’intervallo è importante per i seguenti motivi:

Motivo 1 : questo ci dice la distribuzione dell’intero set di dati.

Motivo 2 : ci dice quali valori estremi sono possibili in un dato set di dati.

Gli esempi seguenti illustrano nella pratica ciascuno di questi motivi.

Motivo 1: l’intervallo ci dice la distribuzione di un intero set di dati

L’intervallo ci dice la distribuzione di un intero set di dati.

Ad esempio, supponiamo di avere il seguente set di dati che mostra i punteggi degli esami di 20 studenti diversi in una classe:

L’intervallo dei risultati dell’esame verrebbe calcolato come segue:

  • Intervallo = Valore massimo – Valore minimo
  • Intervallo = 98 – 68
  • Intervallo = 30

L’intervallo risulta essere 30 . Questo rappresenta la differenza tra il voto più alto dell’esame e il voto più basso della classe.

Conoscendo con precisione questa misurazione, l’insegnante di classe può comprendere rapidamente la distribuzione dei valori nei risultati degli esami tra tutti gli studenti.

Motivo 2: l’intervallo ci dice quali valori estremi sono possibili in un dato set di dati

L’intervallo ci dice quali valori estremi sono possibili in un dato set di dati.

Ad esempio, supponiamo che un agente immobiliare abbia accesso a un database contenente i prezzi di vendita di 100.000 case in una determinata città degli Stati Uniti:

Supponiamo di utilizzare software statistico (come Excel , R , Python , ecc.) per calcolare l’intervallo di questo set di dati e trovare quanto segue:

  • Intervallo = valore massimo – valore minimo
  • Intervallo = 854.000 – 194.000
  • Intervallo = 660.000

Se l’agente immobiliare ha un cliente che ha un budget di acquisto inferiore a $ 194.000 o superiore a $ 854.000, l’agente immobiliare può sapere immediatamente che nessuna casa in quella particolare città soddisferà i criteri per l’acquisto.

Il dietro dell’uso della spiaggia

L’intervallo soffre di uno svantaggio: è influenzato da valori anomali .

Per illustrare ciò, si consideri il seguente set di dati:

Set di dati: 1, 4, 8, 11, 13, 17, 19, 19, 20, 23, 24, 24, 25, 28, 29, 31, 32

L’intervallo di questo set di dati è 32 – 1 = 31 .

Tuttavia, considera se il set di dati avesse un valore anomalo estremo:

Set di dati: 1, 4, 8, 11, 13, 17, 19, 19, 20, 23, 24, 24, 25, 28, 29, 31, 32, 378

L’intervallo di questo set di dati sarebbe ora 378 – 1 = 377 .

Nota come l’intervallo cambia drasticamente a causa di un valore anomalo.

Prima di calcolare l’intervallo di un set di dati, è una buona idea verificare innanzitutto se sono presenti valori anomali che potrebbero rendere l’intervallo fuorviante.

Risorse addizionali

I seguenti tutorial spiegano l’importanza di altre misure nelle statistiche:

Perché la media è importante nelle statistiche?
Perché la mediana è importante nelle statistiche?
Perché la modalità è importante nelle statistiche?
Perché la deviazione standard è importante nelle statistiche?

Aggiungi un commento

Il tuo indirizzo email non sarà pubblicato. I campi obbligatori sono contrassegnati *