Teste g de adequação: definição + exemplo


Em estatística, o teste G para qualidade de ajuste é usado para determinar se uma variável categórica segue ou não uma distribuição hipotética.

Este teste é uma alternativa ao teste de adequação do qui-quadrado e é frequentemente usado quando valores discrepantes estão presentes nos dados ou quando os dados com os quais você está trabalhando são extremamente grandes.

O Teste G de qualidade de ajuste utiliza as seguintes hipóteses nulas e alternativas:

  • H 0 : Uma variável segue uma distribuição hipotética.
  • HA : Uma variável não segue uma distribuição hipotética.

A estatística de teste é calculada da seguinte forma:

G=2 * Σ[O * ln(O/E)]

Ouro:

  • O: O número observado em uma célula
  • E: O número esperado em uma célula

Se o valor p que corresponde à estatística de teste estiver abaixo de um determinado nível de significância , então pode-se rejeitar a hipótese nula e concluir que a variável em estudo não segue a distribuição hipotética.

O exemplo a seguir mostra como realizar um teste G de adequação do ajuste na prática.

Exemplo: teste G de qualidade de ajuste

Um biólogo afirma que existe uma proporção igual de três espécies de tartarugas em uma determinada área. Para testar esta afirmação, um pesquisador independente conta o número de cada tipo de espécie e descobre o seguinte:

  • Espécie A: 80
  • Espécie B: 125
  • Espécie C: 95

O pesquisador independente pode usar as etapas a seguir para realizar um teste G de qualidade de ajuste para determinar se os dados coletados são consistentes com as afirmações do biólogo.

Passo 1: Indique as hipóteses nula e alternativa.

O pesquisador realizará o teste G de qualidade de ajuste usando as seguintes suposições:

  • H 0 : Existe uma proporção igual de três espécies de tartarugas nesta área.
  • HA : Não existe uma proporção igual de três espécies de tartarugas nesta área.

Etapa 2: Calcule a estatística de teste.

A fórmula para calcular a estatística de teste é:

G=2 * Σ[O * ln(O/E)]

Neste exemplo, há um total de 300 tartarugas observadas. Se houvesse uma proporção igual de cada espécie, esperaríamos observar 100 tartarugas de cada espécie. Portanto, podemos calcular a estatística de teste da seguinte forma:

G = 2 * [80*ln(80/100) + 125*ln(125/100) + 95*ln(95/100)] = 10,337

Etapa 3: Calcule o valor p da estatística de teste.

De acordo com a calculadora do qui-quadrado para valor P , o valor p associado a uma estatística de teste de 10,337 e #categories-1 = 3-1 = 2 graus de liberdade é 0,005693 .

Como esse valor de p é inferior a 0,05, o pesquisador rejeitaria a hipótese nula. Isto significa que ela tem provas suficientes para dizer que não existe uma proporção igual de cada espécie de tartaruga naquela área específica.

Bônus: teste G para qualidade de ajuste em R

Você pode usar a função Gtest() do pacote DescTools para realizar rapidamente um teste G de adequação em R.

O código a seguir mostra como realizar um teste G para o exemplo anterior:

 #load the DescTools library
library (DescTools)

#perform the G-test 
GTest(x = c(80, 125, 95), #observed values
      p = c(1/3, 1/3, 1/3), #expected proportions
      correct=" none ")

	Log likelihood ratio (G-test) goodness of fit test

data: c(80, 125, 95)
G = 10.337, X-squared df = 2, p-value = 0.005693

Observe que a estatística do teste G é 10,337 e o valor p correspondente é 0,005693 . Como esse valor p é inferior a 0,05, rejeitaríamos a hipótese nula.

Isso corresponde aos resultados que calculamos manualmente.

Recursos adicionais

Sinta-se à vontade para usar esta calculadora de teste G de adequação para realizar automaticamente um teste G para qualquer conjunto de dados.

Add a Comment

O seu endereço de email não será publicado. Campos obrigatórios marcados com *