Problema da terceira variável: definição e exemplo
Nas estatísticas, um problema de terceira variável ocorre quando uma correlação observada entre duas variáveis pode, na verdade, ser explicada por uma terceira variável que não foi levada em consideração.
Quando esta terceira variável não é levada em consideração, a correlação entre as duas variáveis estudadas pode ser enganosa ou mesmo gerar confusão.
Este tutorial fornece vários exemplos de problemas de terceira variável em diferentes contextos.
Exemplo 1: Cães e hidrantes
Um pesquisador observa que cidades com mais hidrantes também tendem a ter mais cães.
No entanto, estas duas variáveis só estão correlacionadas porque ambas têm uma forte correlação com uma terceira variável: o tamanho da população .
As cidades maiores tendem a ter mais hidrantes e mais cães. Por outro lado, cidades menores tendem a ter menos hidrantes e menos cães.
Exemplo 2: Vendas de sorvete e ataques de tubarões
O pesquisador descobriu que as vendas de sorvete e os ataques de tubarões estão fortemente correlacionados positivamente.
No entanto, estas duas variáveis só estão correlacionadas porque ambas têm uma forte correlação com uma terceira variável: a temperatura .
Quando está mais quente, mais pessoas compram sorvete e mais pessoas nadam no oceano, o que explica por que os valores das vendas de sorvetes e dos ataques de tubarões tendem a aumentar nas mesmas épocas do ano.
Exemplo 3: Voluntários e desastres naturais
Um estudo conclui que quanto mais voluntários se apresentarem após um desastre natural, maiores serão os danos.
No entanto, estas duas variáveis só estão correlacionadas porque ambas têm uma forte correlação com uma terceira variável: a magnitude do desastre natural .
Desastres naturais de maior dimensão estão fortemente correlacionados com mais danos causados, bem como com um aumento no número de voluntários.
Artigos relacionados
O que é viés de variável omitida?
O que é preconceito de subcontagem?
O que é viés de agregação?
O que é uma variável confusa?