Test g di bontà di adattamento: definizione + esempio


In statistica, il test G per la bontà di adattamento viene utilizzato per determinare se una variabile categoriale segue o meno una distribuzione ipotetica.

Questo test è un’alternativa al test della bontà di adattamento del chi quadrato e viene spesso utilizzato quando nei dati sono presenti valori anomali o quando i dati con cui si lavora sono estremamente grandi.

Il G-Test della bontà di adattamento utilizza le seguenti ipotesi nulle e alternative:

  • H 0 : Una variabile segue una distribuzione ipotetica.
  • H A : Una variabile non segue una distribuzione ipotetica.

La statistica del test viene calcolata come segue:

G=2 * Σ[O * ln(O/E)]

Oro:

  • O: il numero osservato in una cella
  • E: il numero previsto in una cella

Se il valore p che corrisponde alla statistica del test è inferiore a un certo livello di significatività , allora puoi rifiutare l’ipotesi nulla e concludere che la variabile studiata non segue la distribuzione ipotizzata.

L’esempio seguente mostra come eseguire nella pratica un test G della bontà di adattamento.

Esempio: test G di bontà di adattamento

Un biologo sostiene che in una certa zona esiste una proporzione uguale di tre specie di tartarughe. Per verificare questa affermazione, un ricercatore indipendente conta il numero di ciascun tipo di specie e trova quanto segue:

  • Specie A: 80
  • Specie B: 125
  • Specie C: 95

Il ricercatore indipendente può utilizzare i passaggi seguenti per eseguire un test G di bontà di adattamento per determinare se i dati raccolti sono coerenti con le affermazioni del biologo.

Passaggio 1: enunciare le ipotesi nulla e alternativa.

Il ricercatore eseguirà il test G di bontà di adattamento utilizzando le seguenti ipotesi:

  • H 0 : In quest’area esiste una proporzione uguale di tre specie di tartarughe.
  • H A : In quest’area non esiste una proporzione uguale di tre specie di tartarughe.

Passaggio 2: calcolare la statistica del test.

La formula per calcolare la statistica del test è:

G=2 * Σ[O * ln(O/E)]

In questo esempio, sono state osservate 300 tartarughe totali. Se ci fosse una proporzione uguale di ciascuna specie, ci aspetteremmo di osservare 100 tartarughe per ciascuna specie. Quindi, possiamo calcolare la statistica del test come segue:

G = 2 * [80*ln(80/100) + 125*ln(125/100) + 95*ln(95/100)] = 10,337

Passaggio 3: calcolare il valore p della statistica del test.

Secondo il calcolatore chi quadrato/valore P , il valore p associato a una statistica test di 10,337 e #categorie-1 = 3-1 = 2 gradi di libertà è 0,005693 .

Poiché questo valore p è inferiore a 0,05, il ricercatore rifiuterebbe l’ipotesi nulla. Ciò significa che ha prove sufficienti per affermare che in quella particolare area non esiste una proporzione uguale di ciascuna specie di tartaruga.

Bonus: test G per la bontà dell’adattamento in R

È possibile utilizzare la funzione Gtest() dal pacchetto DescTools per eseguire rapidamente un test G di bontà di adattamento in R.

Il codice seguente mostra come eseguire un test G per l’esempio precedente:

 #load the DescTools library
library (DescTools)

#perform the G-test 
GTest(x = c(80, 125, 95), #observed values
      p = c(1/3, 1/3, 1/3), #expected proportions
      correct=" none ")

	Log likelihood ratio (G-test) goodness of fit test

data: c(80, 125, 95)
G = 10.337, X-squared df = 2, p-value = 0.005693

Si noti che la statistica del test G è 10,337 e il valore p corrispondente è 0,005693 . Poiché questo valore p è inferiore a 0,05, rifiuteremo l’ipotesi nulla.

Ciò corrisponde ai risultati che abbiamo calcolato manualmente.

Risorse addizionali

Sentiti libero di utilizzare questo calcolatore del test G della bontà di adattamento per eseguire automaticamente un test G per qualsiasi set di dati.

Aggiungi un commento

Il tuo indirizzo email non sarà pubblicato. I campi obbligatori sono contrassegnati *