Come eseguire un test di bontà di adattamento chi quadrato in python


Un test di bontà di adattamento chi quadrato viene utilizzato per determinare se una variabile categoriale segue o meno una distribuzione ipotetica.

Questo tutorial spiega come eseguire un test di bontà di adattamento del chi quadrato in Python.

Esempio: test di bontà di adattamento del chi quadrato in Python

Il proprietario di un negozio afferma che un numero uguale di clienti si reca nel suo negozio ogni giorno della settimana. Per verificare questa ipotesi, un ricercatore registra il numero di clienti che entrano nel negozio in una determinata settimana e rileva quanto segue:

  • Lunedì: 50 clienti
  • Martedì: 60 clienti
  • Mercoledì: 40 clienti
  • Giovedì: 47 clienti
  • Venerdì: 53 clienti

Utilizzare i seguenti passaggi per eseguire un test di bontà di adattamento del chi quadrato in Python per determinare se i dati sono coerenti con la dichiarazione del proprietario del negozio.

Passaggio 1: creare i dati.

Innanzitutto, creeremo due tabelle per contenere il numero di clienti osservato e previsto per ogni giorno:

 expected = [50, 50, 50, 50, 50]
observed = [50, 60, 40, 47, 53]

Passaggio 2: eseguire il test di bontà di adattamento del chi quadrato.

Successivamente, possiamo eseguire il test di bontà di adattamento del chi quadrato utilizzando la funzione chi quadrato della libreria SciPy, che utilizza la seguente sintassi:

chi quadrato (f_obs, f_exp)

Oro:

  • f_obs: un array di conteggi osservati.
  • f_exp: un array di conteggi attesi. Per impostazione predefinita, si presuppone che ciascuna categoria abbia la stessa probabilità.

Il codice seguente mostra come utilizzare questa funzione nel nostro esempio specifico:

 import scipy.stats as stats

#perform Chi-Square Goodness of Fit Test
stats.chisquare(f_obs=observed, f_exp=expected)

(statistic=4.36, pvalue=0.35947)

La statistica del test Chi-quadrato è 4,36 e il corrispondente valore p è 0,35947 .

Si noti che il valore p corrisponde a un valore Chi quadrato con n-1 gradi di libertà (dof), dove n è il numero di diverse categorie. In questo caso, gdl = 5-1 = 4. È possibile utilizzare il calcolatore chi quadrato/valore P per confermare che il valore p che corrisponde a X 2 = 4,36 con gdl = 4 è 0,35947 .

Ricordiamo che un test di bontà di adattamento del chi quadrato utilizza le seguenti ipotesi nulle e alternative:

  • H 0 : (ipotesi nulla) Una variabile segue una distribuzione ipotetica.
  • H 1 : (ipotesi alternativa) Una variabile non segue una distribuzione ipotetica.

Poiché il valore p (0,35947) non è inferiore a 0,05, non riusciamo a rifiutare l’ipotesi nulla. Ciò significa che non abbiamo prove sufficienti per affermare che la reale distribuzione dei clienti sia diversa da quella riportata dal proprietario del negozio.

Aggiungi un commento

Il tuo indirizzo email non sarà pubblicato. I campi obbligatori sono contrassegnati *