Bias da mancata risposta: spiegazione ed esempi
Il bias da mancata risposta è il bias che si verifica quando le persone che rispondono a un sondaggio differiscono in modo significativo da quelle che non rispondono.
Gli errori dovuti alla mancata risposta possono verificarsi per diversi motivi:
- Il sondaggio è mal progettato e porta a mancate risposte. Ad esempio, i sondaggi troppo lunghi senza incentivi possono far sì che un’elevata percentuale di persone non completi il sondaggio.
- Alcune persone hanno maggiori probabilità di rispondere a un particolare sondaggio. Ad esempio, le persone che arrampicano spesso hanno maggiori probabilità di rispondere a un sondaggio su una potenziale nuova struttura per l’arrampicata rispetto alle persone che non arrampicano.
- L’indagine non ha raggiunto tutti i membri di una popolazione. Ad esempio, un sondaggio inviato su una nuova app per telefono potrebbe raggiungere solo i giovani che dispongono dell’app, comportando la mancata risposta da parte dei membri più anziani della popolazione.
- Il sondaggio pone domande scomode sulle informazioni private che dissuadono molte persone dal rispondere.
Per tutti questi motivi possono verificarsi errori di mancata risposta.
Perché la distorsione da mancata risposta è un problema?
La distorsione da mancata risposta è un problema per due ragioni principali:
1. La distorsione da mancata risposta fa sì che il campione non sia rappresentativo della popolazione nel suo complesso. Il vantaggio di raccogliere dati per un campione è che è più veloce e meno costoso rispetto alla raccolta di dati per un’intera popolazione e consente di estrapolare i risultati del campione a una popolazione più ampia.
Tuttavia, per poter estrapolare i risultati, il campione deve essere rappresentativo della nostra popolazione nel suo complesso. Idealmente, vorremmo che il nostro campione fosse una versione “mini” della popolazione.
Sfortunatamente, i bias dovuti alla mancata risposta possono far sì che le persone del nostro campione appaiano molto diverse da quelle della popolazione più ampia.
Ad esempio, supponiamo che una città stia valutando la possibilità di costruire una nuova struttura per l’arrampicata su roccia. Per valutare quanto i residenti della città sarebbero interessati all’utilizzo di questo tipo di strutture, i funzionari della città stanno inviando un breve sondaggio tramite una nuova app per smartphone.
A causa della modalità di svolgimento del sondaggio e del contenuto del sondaggio (domande sull’arrampicata), a rispondere sono soprattutto i giovani che hanno l’applicazione e sono interessati all’arrampicata.
Quindi, quando arrivano i risultati del sondaggio, sembra che la stragrande maggioranza della popolazione della città sia interessata a costruire questa nuova struttura. Purtroppo i risultati dell’indagine non sono rappresentativi della popolazione nel suo insieme.
L’immagine seguente illustra questo problema: supponiamo che i cerchi verdi rappresentino le persone interessate a utilizzare la struttura mentre i cerchi rossi rappresentino le persone che non sono interessate a utilizzare la struttura:
Si noti come il campione non sia rappresentativo della popolazione nel suo complesso. I risultati del sondaggio mostrerebbero che la maggior parte delle persone è entusiasta di una nuova struttura per l’arrampicata. Sfortunatamente, se i funzionari della città presumessero che questo campione fosse rappresentativo della popolazione, potrebbero decidere di costruire la struttura e rendersi presto conto che molte meno persone ne farebbero uso di quanto pensassero.
2. Gli errori dovuti alla mancata risposta possono causare una maggiore varianza nelle stime . Se la dimensione del campione dell’indagine risultasse inferiore a quella prevista dai ricercatori, la varianza nelle stime dello studio potrebbe essere maggiore del previsto.
Ad esempio, attraverso la verifica delle ipotesi , sappiamo che maggiore è la dimensione del nostro campione, minore è la varianza nella nostra stima della media della popolazione o della proporzione della popolazione. Tuttavia, minore è la dimensione del campione, maggiore è la varianza delle stime dei parametri della popolazione e più difficile è trovare un risultato statisticamente significativo.
Esempi di bias per mancata risposta
Gli esempi seguenti illustrano diversi casi in cui possono verificarsi errori di mancata risposta.
Esempio 1
I ricercatori vogliono sapere come gli informatici percepiscono il nuovo software. C’è pressione per ottenere quanti più dati possibili dal sondaggio, quindi i ricercatori progettano un sondaggio che dura circa un’ora. Quando distribuiscono il sondaggio, scoprono che molti lavoratori IT non rispondono affatto o iniziano a rispondere ma finiscono per arrendersi prima di completare l’intero sondaggio.
Quando i ricercatori recuperano i dati, scoprono che gli intervistati percepiscono il software come eccellente e di alta qualità. Tuttavia, una volta presentato il nuovo software al team IT generale, hanno scoperto di ricevere feedback per lo più negativi.
Si è scoperto che le persone che si sono prese il tempo di completare l’intero sondaggio si sono rivelate per lo più informatici alle prime armi, incapaci di valutare i difetti del programma.
Per questo motivo, gli intervistati non riflettevano la popolazione più ampia dei professionisti IT nel suo complesso e i risultati del sondaggio erano quindi inaffidabili.
Esempio 2
I ricercatori vogliono saperne di più sui tassi di consumo di alcol in un determinato college. Decidono di allestire uno stand nel campus dove gli studenti possono fermarsi e rispondere a un questionario su quanto e quanto spesso consumano alcol. Purtroppo il questionario non è anonimo quindi solo gli studenti che bevono poco o per nulla scelgono di compilare il questionario.
Quando i risultati sono arrivati, è emerso che il consumo di alcol era basso e poco frequente tra gli studenti. Sfortunatamente, gli intervistati non riflettono la popolazione studentesca più ampia del campus e pertanto i risultati non sono affidabili.
Esempio 3
Le elezioni presidenziali del 1936 sono un classico esempio di bias per mancata risposta. Una pubblicazione popolare dell’epoca pubblicò un sondaggio che prevedeva che Alf Landon avrebbe sconfitto Franklin D. Roosevelt con una valanga di voti. Tuttavia, quando arrivarono le elezioni, Franklin D. Roosevelt ottenne effettivamente una vittoria schiacciante.
Risulta che dei 10 milioni di questionari inviati, solo 2,3 milioni di persone hanno risposto. I 7,7 milioni che non hanno risposto si sono rivelati molto diversi in termini di preferenze politiche.
Pertanto, i risultati del questionario non riflettevano la popolazione nel suo complesso, motivo per cui la previsione sulla vittoria di Alf Landon si è rivelata così errata.
Come prevenire i bias dovuti alla mancata risposta
Gli errori dovuti alla mancata risposta possono essere evitati (o almeno mitigati) adottando le seguenti misure:
- Progetta l’indagine in modo che sia relativamente breve. Più lungo è un sondaggio, meno è probabile che le persone dedichino tempo alla loro giornata per rispondere.
- Offrire incentivi per il completamento del sondaggio. Gli incentivi generalmente aumentano i tassi di risposta.
- Assicurati che le persone sappiano che le risposte al sondaggio saranno riservate o anonime. Questo generalmente rende le persone più disposte a rispondere.
- Distribuire l’indagine in modo che raggiunga un’ampia percentuale della popolazione, ad esempio utilizzando forme di distribuzione tradizionali anziché una nuova app che poche persone possiedono.
Sebbene non sia sempre possibile eliminare completamente gli effetti dei bias dovuti alla mancata risposta, è possibile minimizzarli utilizzando un metodo di progettazione e distribuzione intelligente dell’indagine.
Risorse addizionali
Cos’è il bias di autoselezione?
Che cos’è il bias di sottostima?
Cos’è il pregiudizio SEO?