Perché la dimensione del campione è importante? (spiegazione ed esempi)


La dimensione del campione si riferisce al numero totale di persone coinvolte in un esperimento o studio.

La dimensione del campione è importante perché influenza direttamente la precisione con cui possiamo stimare i parametri della popolazione.

Per capire perché questo è il caso, è utile avere una conoscenza di base degli intervalli di confidenza.

Una breve spiegazione degli intervalli di confidenza

Nelle statistiche, spesso cerchiamo di misurare i parametri della popolazione – numeri che descrivono determinate caratteristiche di un’intera popolazione.

Ad esempio, potremmo essere interessati a misurare l’altezza media di tutti gli individui in una determinata città.

Tuttavia, spesso è troppo costoso e richiede molto tempo raccogliere dati su ciascun individuo di una popolazione. Quindi di solito prendiamo un campione casuale dalla popolazione e utilizziamo i dati del campione per stimare il parametro della popolazione.

Ad esempio, potremmo raccogliere dati sull’altezza di 100 individui casuali in una città. Possiamo quindi calcolare la dimensione media degli individui nel campione. Tuttavia, non possiamo essere certi che la media campionaria corrisponda esattamente alla media della popolazione.

Per tenere conto di questa incertezza, possiamo creare un intervallo di confidenza . Un intervallo di confidenza è un intervallo di valori che probabilmente contiene un parametro della popolazione con un certo livello di confidenza.

La formula per calcolare un intervallo di confidenza per la media della popolazione è:

Intervallo di confidenza = x +/- z*(s/√ n )

Oro:

  • x : media campionaria
  • z: il valore z scelto
  • s: deviazione standard campionaria
  • n: dimensione del campione

Il valore z utilizzato dipende dal livello di confidenza scelto. La tabella seguente mostra il valore z che corrisponde alle scelte del livello di confidenza più comuni:

Un livello di fiducia valore z
0,90 1.645
0,95 1,96
0,99 2.58

La relazione tra dimensione del campione e intervalli di confidenza

Supponiamo di voler stimare il peso medio di una popolazione di tartarughe. Raccogliamo un campione casuale di tartarughe con le seguenti informazioni:

  • Dimensione del campione n = 25
  • Peso medio del campione x = 300
  • Deviazione standard del campione s = 18,5

Ecco come calcolare l’intervallo di confidenza al 90% per il peso medio della popolazione reale:

Intervallo di confidenza al 90%: 300 +/- 1,645*(18,5/√ 25 ) = [293,91, 306,09]

Siamo sicuri al 90% che il peso medio effettivo delle tartarughe nella popolazione sia compreso tra 293,91 e 306,09 libbre.

Supponiamo ora che invece di 25 tartarughe raccogliamo dati su 50 tartarughe.

Ecco come calcolare l’intervallo di confidenza al 90% per il peso medio della popolazione reale:

Intervallo di confidenza al 90%: 300 +/- 1,645*(18,5/√ 50 ) = [295,79, 304,30]

Si noti che questo intervallo di confidenza è più ristretto rispetto all’intervallo di confidenza precedente. Ciò significa che la nostra stima del peso medio reale della popolazione di tartarughe è più accurata.

Supponiamo ora di raccogliere dati su 100 tartarughe.

Ecco come calcolare l’intervallo di confidenza al 90% per il peso medio della popolazione reale:

Intervallo di confidenza al 90%: 300 +/- 1,645*(18,5/√ 100 ) = [296,96, 303,04]

Si noti che questo intervallo di confidenza è ancora più ristretto del precedente intervallo di confidenza.

La tabella seguente riassume ciascuna ampiezza dell’intervallo di confidenza:

Il punto è questo: maggiore è la dimensione del campione, più accuratamente possiamo stimare un parametro della popolazione .

Risorse addizionali

Le esercitazioni seguenti forniscono spiegazioni più utili sugli intervalli di confidenza e sulla dimensione del campione.

Un’introduzione agli intervalli di confidenza
4 esempi di intervalli di confidenza nella vita reale
Popolazione vs. campione: qual è la differenza?

Aggiungi un commento

Il tuo indirizzo email non sarà pubblicato. I campi obbligatori sono contrassegnati *