Bias di sottostima: spiegazione ed esempi

Di Benjamin anderson Luglio 29, 2023 Guida 0 commenti

La distorsione da sottostima è la distorsione che si verifica quando alcuni membri di una popolazione non sono sufficientemente rappresentati nel campione.

Questo tipo di distorsione si verifica spesso nel campionamento di convenienza enel campionamento a risposta volontaria , in cui si raccoglie un campione facile da ottenere ma spesso soggetto a sottostima di alcuni membri di una popolazione.

Perché la distorsione da sottostima è un problema?

La distorsione da sottostima è un problema perché fa sì che il campione non sia rappresentativo della popolazione. L’obiettivo della raccolta dei dati per un campione è ottenere dati in modo più rapido e semplice rispetto alla raccolta dei dati per un’intera popolazione ed essere in grado di estrapolare i risultati dal campione alla popolazione più ampia. Largo.

Tuttavia, per poter estrapolare i risultati, il campione deve essere rappresentativo della nostra popolazione nel suo insieme. Idealmente, vorremmo che il nostro campione fosse una versione “mini” della popolazione. Sfortunatamente, la distorsione da sottostima può far sì che le persone del nostro campione appaiano molto diverse da quelle della popolazione più ampia.

Ad esempio, supponiamo che i ricercatori vogliano sapere cosa pensano i cittadini di una determinata città riguardo a una potenziale nuova legge. Per raccogliere i dati, si recano in una biblioteca vicina e chiedono ai visitatori cosa pensano della potenziale nuova legge. Sebbene questo sia un modo conveniente per raccogliere dati, i ricercatori rischiano di sottostimare diversi tipi di persone, tra cui:

Persone confinate in casa
Persone a cui semplicemente non piace visitare la biblioteca
Persone che frequentano un’altra biblioteca in un’altra parte della città

Poiché questo studio esclude alcuni tipi di persone, è improbabile che i risultati dello studio siano rappresentativi della popolazione.

Ad esempio, supponiamo che le persone che frequentano questa particolare biblioteca abbiano molte più probabilità di sostenere la potenziale nuova legge rispetto al resto della popolazione. Ciò significa che quando i risultati del sondaggio saranno noti, sembrerà che un’alta percentuale di cittadini di questa città sostenga la potenziale nuova legge, quando in realtà la maggior parte dei cittadini non lo fa.

L’immagine seguente illustra questo problema: supponiamo che i cerchi verdi rappresentino le persone a favore della nuova legge mentre i cerchi rossi rappresentino le persone contrarie alla nuova legge:

Si noti che la maggior parte delle persone a favore della nuova legge sono incluse nel campione, ma non è rappresentativo della popolazione nel suo insieme. Secondo quanto riferito, i risultati del sondaggio mostrano che la maggior parte delle persone è favorevole alla nuova legge, quando in realtà ciò non è vero.

Esempi di bias di sottostima

Gli esempi seguenti illustrano diversi casi in cui può verificarsi una distorsione da sottostima.

Esempio 1

I ricercatori vogliono sapere cosa pensano i cittadini di una determinata città della costruzione di un nuovo parco. Per raccogliere dati, i ricercatori partecipano a un incontro cittadino locale e chiedono ai residenti cosa pensano. Sfortunatamente, questa forma di campionamento di convenienza può soffrire di una sottostima dei seguenti gruppi:

Persone che non hanno accesso ai mezzi di trasporto per recarsi alle riunioni comunali
Gente che non sa nemmeno che si stanno svolgendo le riunioni cittadine
Persone che lavorano la sera e semplicemente non possono partecipare alle riunioni cittadine

Pertanto, le opinioni di queste persone non verranno prese in considerazione nei risultati dello studio. A causa della sottostima di questi gruppi specifici, è improbabile che il campione sia rappresentativo della popolazione nel suo insieme.

Esempio 2

I ricercatori vogliono sapere quante ore al giorno le persone guardano la televisione in un dato paese. Per raccogliere i dati per lo studio, hanno scelto casualmente nomi da un elenco telefonico locale e hanno chiamato le persone per chiedere loro informazioni sul consumo televisivo. Questa è una forma di campionamento di convenienza e potrebbe soffrire di sottostima dei seguenti gruppi:

Persone molto facoltose che non riportano i propri numeri di telefono negli elenchi telefonici locali
Giovani che usano solo cellulari e i cui numeri non figurano negli elenchi telefonici locali

Pertanto, in questo studio la quantità di televisione guardata da persone molto ricche e da giovani sarà sottostimata. A causa della sottostima di questi gruppi specifici, è improbabile che il campione sia rappresentativo della popolazione nel suo insieme.

Esempio 3

I ricercatori vogliono sapere cosa pensano i cittadini di una determinata città riguardo al nuovo codice della strada. Quindi distribuiscono un questionario alle persone che passano per un centro commerciale locale. Si tratta di una forma di campionamento di convenienza che può soffrire di una sottocopertura dei seguenti gruppi:

Persone che non hanno accesso ai mezzi di trasporto per raggiungere il centro commerciale (e quindi in gran parte non sono interessate dal codice della strada)
Persone a cui non piace andare al centro commerciale (e quindi potrebbero scegliere di non guidare in zone trafficate)
Persone che vanno in un altro centro commerciale in un’altra città

Come prevenire i bias di sottostima

La distorsione da sottostima spesso deriva dal campionamento di convenienza. Per eliminare (o almeno minimizzare) gli effetti della distorsione da sottostima, una forma migliore di campionamento consiste nell’utilizzare un campione casuale semplice .

In questo tipo di campione, ogni membro di una popolazione ha la stessa probabilità di essere selezionato per far parte del campione.

Il vantaggio di questo approccio è che i campioni casuali semplici sono generalmente rappresentativi della popolazione di interesse poiché ciascun membro ha le stesse probabilità di essere incluso nel campione.

Quando utilizziamo questo approccio invece del campionamento di convenienza, possiamo essere più fiduciosi nella nostra capacità di estrapolare i risultati del campione alla popolazione più ampia, perché è probabile che i membri di ogni (o quasi ogni) gruppo della popolazione siano inclusi nel campione. . .

Risorse addizionali

Cos’è il bias di autoselezione?
Cos’è il pregiudizio SEO?
Cos’è il bias da mancata risposta?

Informazioni sull'autore

Benjamin anderson

Ciao, sono Benjamin, un professore di statistica in pensione diventato insegnante dedicato di Statorials. Con una vasta esperienza e competenza nel campo della statistica, sono ansioso di condividere le mie conoscenze per potenziare gli studenti attraverso Statorials. Scopri di più