Come eseguire il test esatto di fisher in python
Il test esatto di Fisher viene utilizzato per determinare se esiste o meno un’associazione significativa tra due variabili categoriali.
Viene generalmente utilizzato come alternativa al test di indipendenza chi quadrato quando uno o più conteggi di celle in una tabella 2 × 2 sono inferiori a 5.
Questo tutorial spiega come eseguire il test esatto di Fisher in Python.
Esempio: test esatto di Fisher in Python
Supponiamo di voler sapere se il genere è associato o meno alla preferenza per un partito politico in un particolare college.
Per esplorare questo aspetto, abbiamo intervistato in modo casuale 25 studenti del campus. Il numero di studenti democratici o repubblicani, in base al sesso, è mostrato nella tabella seguente:
Democratico | Repubblicano | |
---|---|---|
Femmina | 8 | 4 |
Maschio | 4 | 9 |
Per determinare se esiste un’associazione statisticamente significativa tra genere e preferenza del partito politico, possiamo utilizzare i seguenti passaggi per eseguire il test esatto di Fisher in Python:
Passaggio 1: creare i dati.
Per prima cosa creeremo una tabella per contenere i nostri dati:
data = [[8, 4], [4, 9]]
Passaggio 2: eseguire il test esatto di Fisher.
Successivamente, possiamo eseguire il test esatto di Fisher utilizzando la funzione fisher_exact della libreria SciPy, che utilizza la seguente sintassi:
fisher_exact(tabella, alternativa=’due facce’)
Oro:
- tabella: una tabella di contingenza 2×2
- alternativa: definisce l’ipotesi alternativa. L’impostazione predefinita è “fronte-retro”, ma è anche possibile scegliere “meno” o “maggiore” per i test a una facciata.
Il codice seguente mostra come utilizzare questa funzione nel nostro esempio specifico:
import scipy.stats as stats print(stats.fisher_exact(data)) (4.5, 0.1152)
Il valore p per il test è 0,1152 .
Il test esatto di Fisher utilizza le seguenti ipotesi nulle e alternative:
- H 0 : (ipotesi nulla) Le due variabili sono indipendenti.
- H 1 : (ipotesi alternativa) Le due variabili non sono indipendenti.
Poiché questo valore p non è inferiore a 0,05, non rifiutiamo l’ipotesi nulla.
Pertanto non abbiamo prove sufficienti per affermare che esista un’associazione significativa tra le preferenze di genere e quelle dei partiti politici.
In altre parole, le preferenze di genere e di partito politico sono indipendenti.