Che cos'è il bias di aggregazione? (spiegazione ed esempio)
Gli errori di aggregazione si verificano quando si presume erroneamente che le tendenze osservate nei dati aggregati si applichino anche ai singoli punti dati.
Il modo più semplice per comprendere questo tipo di pregiudizio è fare un semplice esempio.
Esempio: bias di aggregazione
Supponiamo che i ricercatori vogliano comprendere la relazione tra gli anni medi di istruzione e il reddito familiare medio in un determinato stato. Ottengono dati aggregati per 4 diverse città dello stato e calcolano la correlazione tra istruzione media e reddito familiare medio.
Risulta che la correlazione tra gli anni medi di istruzione e il reddito familiare medio è 0,9632 . Questo è un coefficiente di correlazione molto positivo.
I ricercatori creano persino un grafico a dispersione per visualizzare la relazione tra gli anni medi di istruzione e il reddito familiare medio:
Senza esaminare effettivamente i dati individuali, potrebbero pubblicare un rapporto in cui si afferma che più anni di istruzione sono fortemente correlati positivamente al reddito familiare.
Supponiamo, tuttavia, che un nuovo ricercatore arrivi un anno dopo e ottenga dati sulle singole famiglie nello stesso insieme di città. Supponiamo che crei il seguente diagramma a dispersione dei dati:
Calcola la correlazione tra le due variabili e scopre che in realtà è solo 0,1788 : è ancora una correlazione positiva, ma non così forte come la correlazione trovata dai ricercatori precedenti.
Si scopre che quando i dati sono stati aggregati, coprivano la vera tendenza tra istruzione e reddito che si stava verificando a livello individuale.
Infatti, se guardiamo città per città nel grafico a dispersione, la relazione tra istruzione e reddito è in realtà negativa!
Effetti del bias di aggregazione
I bias di aggregazione si verificano abbastanza spesso nella ricerca semplicemente perché spesso si presume erroneamente che le tendenze che appaiono a livello aggregato debbano apparire anche a livello individuale. Purtroppo non è sempre così, come dimostra l’esempio precedente.
I bias di aggregazione possono far sì che i risultati di uno studio traggano conclusioni errate e siano fuorvianti. Questo tipo di bias è particolarmente dannoso quando riguarda le correlazioni tra variabili.
Anche se la correlazione tra i dati aggregati di due variabili è positiva, la correlazione sottostante tra le due variabili a livello di singola osservazione può in realtà essere:
- Correlazione negativa
- Nessuna correlazione
- Correlazione positiva
Il modo per evitare questo tipo di distorsione è condurre studi utilizzando dati individuali anziché aggregati, in modo da poter scoprire la vera relazione tra due variabili.