Variáveis instrumentais: definição e exemplos


Muitas vezes, em estatística, procuramos estimar o efeito de uma variável sobre outra. Por exemplo, podemos querer saber:

  • Como o tempo gasto estudando afeta as notas dos exames?
  • Como um determinado medicamento afeta a pressão arterial?
  • Como o estresse afeta a frequência cardíaca?

Em cada cenário, queremos entender se uma variável preditora afeta ou não uma variável de resposta . No entanto, muitas vezes existem outras variáveis que afetam a relação entre as duas variáveis.

Por exemplo, suponha que usamos um determinado medicamento como variável preditora e a pressão arterial como variável resposta. Estamos interessados apenas no efeito da droga na pressão arterial:

No entanto, outras variáveis, como o tempo gasto em exercícios, a dieta geral e o nível de estresse, também afetam a pressão arterial:

Assim, se realizarmos uma regressão linear simples usando o medicamento como variável preditora e a pressão arterial como variável resposta, não podemos ter certeza de que os coeficientes de regressão capturarão com precisão o efeito do medicamento na pressão arterial, porque fatores externos (exercício, dieta, estresse, etc.) também podem desempenhar um papel.

Uma maneira potencial de contornar esse problema é usar uma variável instrumental .

O que é uma variável instrumental?

Uma variável instrumental é uma terceira variável introduzida na análise de regressão que está correlacionada com a variável preditora, mas não correlacionada com a variável resposta. Usando esta variável, torna-se possível estimar o verdadeiro efeito causal que uma variável preditora tem sobre uma variável resposta.

Por exemplo, suponha que queiramos estimar o efeito de um determinado medicamento na pressão arterial:

Um exemplo de variável instrumental que podemos utilizar nesta análise de regressão é a proximidade de um indivíduo a uma farmácia.

Esta variável de “proximidade” provavelmente estaria altamente correlacionada com o fato de o indivíduo tomar ou não o medicamento em questão, já que um indivíduo não seria capaz de obtê-lo se não morasse perto de uma farmácia.

Porém, a variável “proximidade” não deve ter correlação com a pressão arterial. A única associação que teria com a pressão arterial seria através da variável preditora.

Instrumental variável

A maneira como realmente usamos uma variável instrumental é realizar uma regressão de variável instrumental, às vezes chamada de regressão de mínimos quadrados em dois estágios .

Regressão de variáveis instrumentais

A regressão de variáveis instrumentais (ou regressão de mínimos quadrados em dois estágios) usa a seguinte abordagem para estimar o efeito de uma variável preditora em uma variável de resposta:

Etapa 1: ajuste um modelo de regressão usando a variável instrumental como variável preditora.

Em nosso exemplo específico, primeiro ajustaríamos o seguinte modelo de regressão:

Certos medicamentos = B 0 + B 1 (proximidade)

Ficaríamos então com valores previstos para determinados medicamentos (cd), que chamaremos de cd hat .

Passo 2: Ajustar um segundo modelo de regressão usando os valores previstos para cd hat .

A seguir, ajustaremos o seguinte modelo de regressão:

Pressão arterial = B 0 + B 1 ( chapéu cd)

Se o coeficiente de regressão de cd hat for estatisticamente significativo, então podemos dizer que há um efeito causal do medicamento na pressão arterial.

A razão pela qual podemos dizer isso é porque usamos apenas o termo “proximidade” para criar o CD Hat e sabemos que a proximidade não deve ser correlacionada com a pressão arterial, qualquer correlação significativa na regressão do segundo estágio pode ser atribuída a um determinado medicamento.

Cuidados quanto ao uso de variáveis instrumentais

Uma variável instrumental só deve ser utilizada se atender aos seguintes critérios:

  • Está fortemente correlacionado com a variável preditiva.
  • Não está correlacionado com a variável de resposta.
  • Não está correlacionado com outras variáveis excluídas do modelo (por exemplo, a proximidade não está correlacionada com exercício, dieta ou estresse).

Se uma variável instrumental não cumprir este critério, não deverá ser utilizada no modelo de regressão porque provavelmente produzirá resultados não fiáveis e tendenciosos.

Add a Comment

O seu endereço de email não será publicado. Campos obrigatórios marcados com *