Valor p vs. alfa: qual é a diferença?
Dois termos que os alunos costumam confundir em estatística são valor p e alfa .
Ambos os termos são usados em testes de hipóteses , que são testes estatísticos formais que usamos para rejeitar ou não rejeitar uma hipótese.
Por exemplo, suponhamos a hipótese de que uma nova pílula reduz a pressão arterial dos pacientes mais do que a pílula padrão atual.
Para testar isso, podemos realizar um teste de hipótese no qual definimos as seguintes hipóteses nulas e alternativas:
Hipótese nula: Não há diferença entre a nova pílula e a pílula padrão.
Hipótese alternativa: Existe uma diferença entre a nova pílula e a pílula padrão.
Se assumirmos que a hipótese nula é verdadeira, o valor p do teste nos diz a probabilidade de obter um efeito pelo menos tão grande quanto aquele que realmente observamos nos dados da amostra.
Por exemplo, suponha que descobrimos que o valor p para o teste de hipótese é 0,02.
Veja como interpretar esse valor p: se realmente não houve diferença entre a nova pílula e a pílula padrão, então 2% das vezes que executarmos esse teste de hipótese obteremos o efeito observado na amostra de dados, ou mais, simplesmente devido a um erro de amostragem aleatório.
Isto nos diz que a obtenção das amostras de dados que realmente obtivemos seria bastante rara se não houvesse realmente nenhuma diferença entre a nova pílula e a pílula padrão.
Assim, estaríamos inclinados a rejeitar a hipótese nula e concluir que existe uma diferença entre a nova pílula e a pílula padrão.
Mas que limite devemos usar para determinar se o nosso valor p é baixo o suficiente para rejeitar a hipótese nula?
É aqui que entra o alfa!
Nível alfa
O nível alfa de um teste de hipótese é o limite que usamos para determinar se nosso valor p é baixo o suficiente para rejeitar a hipótese nula. Geralmente é definido como 0,05, mas às vezes é definido como 0,01 ou 0,10.
Por exemplo, se definirmos o nível alfa de um teste de hipótese como 0,05 e obtermos um valor p de 0,02, rejeitaremos a hipótese nula, uma vez que o valor p é menor que o nível alfa. Assim, concluiríamos que temos evidências suficientes para dizer que a hipótese alternativa é verdadeira.
É importante notar que o nível alfa também define a probabilidade de rejeitar falsamente uma hipótese nula verdadeira.
Por exemplo, digamos que queremos testar se existe ou não uma diferença na redução média da pressão arterial entre uma nova pílula e a pílula atual. E vamos supor que não haja diferença entre as duas pílulas.
Se definirmos o nível alfa de um teste de hipótese em 0,05, isso significa que se repetirmos o processo de teste de hipótese várias vezes, esperaríamos rejeitar falsamente a hipótese nula em cerca de 5% dos casos. testes.
Como escolher o nível Alpha
Conforme mencionado anteriormente, a escolha mais comum para o nível alfa de um teste de hipótese é 0,05. No entanto, em algumas situações em que conclusões erradas levam a consequências graves, podemos definir o nível alfa ainda mais baixo, talvez 0,01.
Por exemplo, na área médica, é comum que os pesquisadores definam o nível alfa em 0,01 porque querem ter certeza de que os resultados de um teste de hipótese são confiáveis.
Por outro lado, em áreas como marketing, pode ser mais comum definir o nível alfa mais alto, como 0,10, porque as consequências de cometer um erro não são de vida nem de morte.
Deve-se notar que aumentar o nível alfa de um teste aumentará as chances de encontrar um resultado de teste de significância, mas também aumentará as chances de rejeitarmos falsamente uma hipótese nula verdadeira.
Resumo:
Aqui está o que aprendemos neste artigo:
1. Um valor p nos diz a probabilidade de obter um efeito pelo menos tão grande quanto aquele que realmente observamos nos dados da amostra.
2. Um nível alfa é a probabilidade de rejeitar falsamente uma hipótese nula verdadeira.
3. Se o valor p de um teste de hipótese for menor que o nível alfa, podemos rejeitar a hipótese nula.
4. Aumentar o nível alfa de um teste aumenta a chance de encontrarmos um resultado de teste significativo, mas também aumenta a chance de rejeitarmos falsamente uma hipótese nula verdadeira.
Recursos adicionais
Introdução ao teste de hipóteses
Como escrever uma hipótese nula (5 exemplos)
Como identificar uma esquerda vs. Teste certo