Che cos'è il bias di aggregazione? (spiegazione ed esempio)

Di Benjamin anderson Luglio 27, 2023 Guida 0 commenti

Gli errori di aggregazione si verificano quando si presume erroneamente che le tendenze osservate nei dati aggregati si applichino anche ai singoli punti dati.

Il modo più semplice per comprendere questo tipo di pregiudizio è fare un semplice esempio.

Esempio: bias di aggregazione

Supponiamo che i ricercatori vogliano comprendere la relazione tra gli anni medi di istruzione e il reddito familiare medio in un determinato stato. Ottengono dati aggregati per 4 diverse città dello stato e calcolano la correlazione tra istruzione media e reddito familiare medio.

Risulta che la correlazione tra gli anni medi di istruzione e il reddito familiare medio è 0,9632 . Questo è un coefficiente di correlazione molto positivo.

I ricercatori creano persino un grafico a dispersione per visualizzare la relazione tra gli anni medi di istruzione e il reddito familiare medio:

Senza esaminare effettivamente i dati individuali, potrebbero pubblicare un rapporto in cui si afferma che più anni di istruzione sono fortemente correlati positivamente al reddito familiare.

Supponiamo, tuttavia, che un nuovo ricercatore arrivi un anno dopo e ottenga dati sulle singole famiglie nello stesso insieme di città. Supponiamo che crei il seguente diagramma a dispersione dei dati:

Distorsione da aggregazione

Calcola la correlazione tra le due variabili e scopre che in realtà è solo 0,1788 : è ancora una correlazione positiva, ma non così forte come la correlazione trovata dai ricercatori precedenti.

Si scopre che quando i dati sono stati aggregati, coprivano la vera tendenza tra istruzione e reddito che si stava verificando a livello individuale.

Infatti, se guardiamo città per città nel grafico a dispersione, la relazione tra istruzione e reddito è in realtà negativa!

Esempio di bias di aggregazione nelle statistiche

Effetti del bias di aggregazione

I bias di aggregazione si verificano abbastanza spesso nella ricerca semplicemente perché spesso si presume erroneamente che le tendenze che appaiono a livello aggregato debbano apparire anche a livello individuale. Purtroppo non è sempre così, come dimostra l’esempio precedente.

I bias di aggregazione possono far sì che i risultati di uno studio traggano conclusioni errate e siano fuorvianti. Questo tipo di bias è particolarmente dannoso quando riguarda le correlazioni tra variabili.

Anche se la correlazione tra i dati aggregati di due variabili è positiva, la correlazione sottostante tra le due variabili a livello di singola osservazione può in realtà essere:

Correlazione negativa
Nessuna correlazione
Correlazione positiva

Il modo per evitare questo tipo di distorsione è condurre studi utilizzando dati individuali anziché aggregati, in modo da poter scoprire la vera relazione tra due variabili.

Informazioni sull'autore

Benjamin anderson

Ciao, sono Benjamin, un professore di statistica in pensione diventato insegnante dedicato di Statorials. Con una vasta esperienza e competenza nel campo della statistica, sono ansioso di condividere le mie conoscenze per potenziare gli studenti attraverso Statorials. Scopri di più

Esempio: bias di aggregazione

Effetti del bias di aggregazione

Informazioni sull'autore

Benjamin anderson

Aggiungi un commento