O que é viés de agregação? (explicação e exemplo)


O viés de agregação ocorre quando se presume incorretamente que as tendências observadas nos dados agregados também se aplicam a pontos de dados individuais.

A maneira mais fácil de entender esse tipo de preconceito é tomar um exemplo simples.

Exemplo: viés de agregação

Suponhamos que os investigadores queiram compreender a relação entre os anos médios de escolaridade e o rendimento médio familiar num determinado estado. Eles obtêm dados agregados de quatro cidades diferentes do estado e calculam a correlação entre escolaridade média e renda familiar média.

Acontece que a correlação entre a média de anos de escolaridade e o rendimento médio familiar é de 0,9632 . Este é um coeficiente de correlação muito positivo.

Os pesquisadores até criam um gráfico de dispersão para visualizar a relação entre os anos médios de educação e a renda familiar média:

Sem realmente olharem para os dados individuais, poderiam divulgar um relatório afirmando que mais anos de educação estão fortemente correlacionados positivamente com o rendimento familiar.

Suponhamos, contudo, que um novo investigador chegue um ano mais tarde e obtenha dados sobre agregados familiares individuais no mesmo conjunto de cidades. Suponha que ela crie o seguinte gráfico de dispersão dos dados:

Viés de agregação

Ela calcula a correlação entre as duas variáveis e descobre que na verdade é apenas 0,1788 – ainda uma correlação positiva, mas nem de longe tão forte como a correlação encontrada por investigadores anteriores.

Acontece que quando os dados foram agregados, cobriram a verdadeira tendência entre educação e rendimento que ocorria a nível individual.

Na verdade, quando olhamos cidade por cidade no gráfico de dispersão, a relação entre educação e rendimento é na verdade negativa!

Exemplo de viés de agregação em estatísticas

Efeitos do viés de agregação

O viés de agregação ocorre com bastante frequência na pesquisa, simplesmente porque muitas vezes se assume incorretamente que as tendências que aparecem no nível agregado também devem aparecer no nível individual. Infelizmente, nem sempre é esse o caso, como mostra o exemplo anterior.

O viés de agregação pode fazer com que os resultados de um estudo tirem conclusões incorretas e sejam enganosos. Este tipo de viés é particularmente prejudicial quando se trata de correlações entre variáveis.

Mesmo que a correlação entre os dados agregados de duas variáveis seja positiva, a correlação subjacente entre as duas variáveis ao nível de uma observação individual pode na verdade ser:

  • Correlação negativa
  • Nenhuma correlação
  • Correlação positiva

A maneira de evitar esse tipo de viés é realizar estudos usando pontos de dados individuais, em vez de pontos de dados agregados, para que você possa descobrir a verdadeira relação entre duas variáveis.

Add a Comment

O seu endereço de email não será publicado. Campos obrigatórios marcados com *