Teste g de adequação: definição + exemplo
Em estatística, o teste G para qualidade de ajuste é usado para determinar se uma variável categórica segue ou não uma distribuição hipotética.
Este teste é uma alternativa ao teste de adequação do qui-quadrado e é frequentemente usado quando valores discrepantes estão presentes nos dados ou quando os dados com os quais você está trabalhando são extremamente grandes.
O Teste G de qualidade de ajuste utiliza as seguintes hipóteses nulas e alternativas:
- H 0 : Uma variável segue uma distribuição hipotética.
- HA : Uma variável não segue uma distribuição hipotética.
A estatística de teste é calculada da seguinte forma:
G=2 * Σ[O * ln(O/E)]
Ouro:
- O: O número observado em uma célula
- E: O número esperado em uma célula
Se o valor p que corresponde à estatística de teste estiver abaixo de um determinado nível de significância , então pode-se rejeitar a hipótese nula e concluir que a variável em estudo não segue a distribuição hipotética.
O exemplo a seguir mostra como realizar um teste G de adequação do ajuste na prática.
Exemplo: teste G de qualidade de ajuste
Um biólogo afirma que existe uma proporção igual de três espécies de tartarugas em uma determinada área. Para testar esta afirmação, um pesquisador independente conta o número de cada tipo de espécie e descobre o seguinte:
- Espécie A: 80
- Espécie B: 125
- Espécie C: 95
O pesquisador independente pode usar as etapas a seguir para realizar um teste G de qualidade de ajuste para determinar se os dados coletados são consistentes com as afirmações do biólogo.
Passo 1: Indique as hipóteses nula e alternativa.
O pesquisador realizará o teste G de qualidade de ajuste usando as seguintes suposições:
- H 0 : Existe uma proporção igual de três espécies de tartarugas nesta área.
- HA : Não existe uma proporção igual de três espécies de tartarugas nesta área.
Etapa 2: Calcule a estatística de teste.
A fórmula para calcular a estatística de teste é:
G=2 * Σ[O * ln(O/E)]
Neste exemplo, há um total de 300 tartarugas observadas. Se houvesse uma proporção igual de cada espécie, esperaríamos observar 100 tartarugas de cada espécie. Portanto, podemos calcular a estatística de teste da seguinte forma:
G = 2 * [80*ln(80/100) + 125*ln(125/100) + 95*ln(95/100)] = 10,337
Etapa 3: Calcule o valor p da estatística de teste.
De acordo com a calculadora do qui-quadrado para valor P , o valor p associado a uma estatística de teste de 10,337 e #categories-1 = 3-1 = 2 graus de liberdade é 0,005693 .
Como esse valor de p é inferior a 0,05, o pesquisador rejeitaria a hipótese nula. Isto significa que ela tem provas suficientes para dizer que não existe uma proporção igual de cada espécie de tartaruga naquela área específica.
Bônus: teste G para qualidade de ajuste em R
Você pode usar a função Gtest() do pacote DescTools para realizar rapidamente um teste G de adequação em R.
O código a seguir mostra como realizar um teste G para o exemplo anterior:
#load the DescTools library library (DescTools) #perform the G-test GTest(x = c(80, 125, 95), #observed values p = c(1/3, 1/3, 1/3), #expected proportions correct=" none ") Log likelihood ratio (G-test) goodness of fit test data: c(80, 125, 95) G = 10.337, X-squared df = 2, p-value = 0.005693
Observe que a estatística do teste G é 10,337 e o valor p correspondente é 0,005693 . Como esse valor p é inferior a 0,05, rejeitaríamos a hipótese nula.
Isso corresponde aos resultados que calculamos manualmente.
Recursos adicionais
Sinta-se à vontade para usar esta calculadora de teste G de adequação para realizar automaticamente um teste G para qualquer conjunto de dados.