Uma explicação dos valores p e significância estatística


Em estatística, os valores p são comumente usados em testes de hipóteses para testes t, testes de qui-quadrado, análise de regressão, ANOVAs e vários outros métodos estatísticos.

Embora sejam tão comuns, muitas vezes as pessoas interpretam os valores p incorretamente, o que pode levar a erros na interpretação dos resultados de uma análise ou estudo.

Este artigo explica como compreender e interpretar os valores p de forma clara e prática.

Testando hipóteses

Para entender os valores p, primeiro precisamos entender o conceito de teste de hipóteses .

Uma hipótese de teste é um teste estatístico formal que usamos para rejeitar ou não rejeitar uma hipótese. Por exemplo, podemos levantar a hipótese de que um novo medicamento, método ou procedimento tem certas vantagens sobre um medicamento, método ou procedimento atual.

Para testar isso, podemos realizar um teste de hipótese onde usamos uma hipótese nula e alternativa:

Hipótese Nula – Não há efeito ou diferença entre o novo método e o método antigo.

Hipótese Alternativa – Existe um efeito ou diferença entre o novo método e o método antigo.

Um valor p indica quão credível é a hipótese nula, dados os dados da amostra. Especificamente, assumindo que a hipótese nula é verdadeira, o valor p indica-nos a probabilidade de obter um efeito pelo menos tão grande quanto aquele que realmente observamos nos dados da amostra.

Se o valor p de um teste de hipótese for suficientemente baixo, podemos rejeitar a hipótese nula. Especificamente, quando realizamos testes de hipóteses, precisamos escolher um nível de significância desde o início. As escolhas comuns para níveis de significância são 0,01, 0,05 e 0,10.

Se os valores p estiverem abaixo do nosso nível de significância, podemos rejeitar a hipótese nula.

Caso contrário, se o valor p for igual ou superior ao nosso nível de significância, não rejeitaremos a hipótese nula.

Como interpretar um valor P

A definição clássica de um valor p é:

Um valor p é a probabilidade de observar uma estatística de amostra que seja pelo menos tão extrema quanto sua estatística de amostra, dado que a hipótese nula é verdadeira.

Por exemplo, suponha que uma fábrica afirme produzir pneus com peso médio de 200 libras. Um auditor levanta a hipótese de que o peso médio real dos pneus produzidos nesta fábrica é diferente em 200 libras. Então ele realiza um teste de hipótese e descobre que o valor p do teste é 0,04. Veja como interpretar esse valor p:

Se a fábrica realmente produz pneus com peso médio de 200 libras, então 4% de todas as auditorias atingirão o efeito observado na amostra, ou mais, devido a erro de amostragem aleatória. Isso nos diz que a obtenção dos dados amostrais obtidos pelo auditor seria bastante rara se a fábrica realmente produzisse pneus com peso médio de 200 libras.

Dependendo do nível de significância utilizado neste teste de hipótese, o auditor provavelmente rejeitaria a hipótese nula de que o peso médio real dos pneus produzidos nesta fábrica é de facto de 200 libras. As amostras de dados obtidas durante a auditoria não são muito consistentes com a hipótese nula.

Como não interpretar um valor P

O maior equívoco sobre os valores p é que eles equivalem à probabilidade de cometer um erro ao rejeitar uma hipótese nula verdadeira (chamada de erro Tipo I).

Existem duas razões principais pelas quais os valores p não podem corresponder à taxa de erro:

1. Os valores P são calculados com base na suposição de que a hipótese nula é verdadeira e que a diferença entre os dados da amostra e a hipótese nula se deve simplesmente ao acaso. Portanto, os valores p não podem dizer a probabilidade do valor zero ser verdadeiro ou falso, uma vez que é 100% verdadeiro do ponto de vista dos cálculos.

2. Embora um valor p baixo indique que os dados da sua amostra são improváveis, assumindo que zero é verdadeiro, um valor p ainda não pode dizer qual dos seguintes casos é mais provável:

  • O nulo é falso
  • O valor zero é verdadeiro, mas você obteve uma amostra estranha

Em comparação com o exemplo anterior, aqui está uma maneira correta e incorreta de interpretar o valor p:

  • Interpretação correta: Supondo que a fábrica produza pneus com peso médio de 200 libras, você obteria a diferença observada em sua amostra ou uma diferença mais extrema em 4% das auditorias devido à amostragem aleatória.
  • Interpretação incorreta: Se você rejeitar a hipótese nula, há 4% de chance de estar cometendo um erro.

Exemplos de interpretação de valores P

Os exemplos a seguir ilustram as maneiras corretas de interpretar valores-p no contexto de testes de hipóteses.

Exemplo 1

Uma companhia telefônica afirma que 90% de seus clientes estão satisfeitos com seu serviço. Para testar esta afirmação, um investigador independente reuniu uma amostra aleatória simples de 200 clientes e perguntou-lhes se estavam satisfeitos com o seu serviço, ao que 85% disseram que sim. O valor p associado a esta amostra de dados foi de 0,018.

Interpretação correta do valor p: Supondo que 90% dos clientes estejam realmente satisfeitos com seu serviço, o pesquisador obteria a diferença observada que obteve em sua amostra ou uma diferença mais extrema em 1,8% das auditorias devido a uma amostragem aleatória erro. .

Exemplo 2

Uma empresa inventa uma nova bateria para telefones. A empresa afirma que esta nova bateria durará pelo menos 10 minutos a mais do que a bateria antiga. Para testar essa afirmação, um pesquisador coleta uma amostra aleatória simples de 80 baterias novas e 80 baterias usadas. As baterias novas duram em média 120 minutos com desvio padrão de 12 minutos e as baterias antigas duram em média 115 minutos com desvio padrão de 15 minutos. O valor p resultante do teste de diferença nas médias populacionais é 0,011.

Interpretação correta do valor p: Supondo que a nova bateria funcione pela mesma duração ou menos que a bateria antiga, o pesquisador obteria a diferença observada ou uma diferença mais extrema em 1,1% dos estudos devido ao erro de amostragem aleatória.

Add a Comment

O seu endereço de email não será publicado. Campos obrigatórios marcados com *