Hoe fisher's exact-test in python uit te voeren
Fisher’s exact test wordt gebruikt om te bepalen of er al dan niet een significant verband bestaat tussen twee categorische variabelen.
Het wordt over het algemeen gebruikt als alternatief voor de chikwadraattest van onafhankelijkheid wanneer een of meer celaantallen in een 2 × 2-tabel kleiner zijn dan 5.
In deze tutorial wordt uitgelegd hoe u de exacte test van Fisher in Python uitvoert.
Voorbeeld: Fisher’s exact-test in Python
Stel dat we willen weten of gender wel of niet geassocieerd is met de voorkeur voor een politieke partij op een bepaalde universiteit.
Om dit te onderzoeken, ondervragen we willekeurig 25 studenten op de campus. Het aantal Democratische of Republikeinse studenten, op basis van hun geslacht, wordt weergegeven in de onderstaande tabel:
Democraat | Republikeins | |
---|---|---|
Vrouwelijk | 8 | 4 |
Mannelijk | 4 | 9 |
Om te bepalen of er een statistisch significant verband bestaat tussen geslacht en politieke partijvoorkeur, kunnen we de volgende stappen gebruiken om Fisher’s exact test uit te voeren in Python:
Stap 1: Creëer de gegevens.
Eerst maken we een tabel waarin we onze gegevens bewaren:
data = [[8, 4], [4, 9]]
Stap 2: Voer de exacte test van Fisher uit.
Vervolgens kunnen we Fisher’s exact-test uitvoeren met behulp van de fisher_exact-functie uit de SciPy-bibliotheek, die de volgende syntaxis gebruikt:
fisher_exact(tabel, alternatief=’twee gezichten‘)
Goud:
- tabel: een kruistabel van 2×2
- alternatief: definieert de alternatieve hypothese. De standaardwaarde is ‘tweezijdig’, maar voor eenzijdige tests kun je ook ‘minder’ of ‘groter’ kiezen.
De volgende code laat zien hoe u deze functie kunt gebruiken in ons specifieke voorbeeld:
import scipy.stats as stats print(stats.fisher_exact(data)) (4.5, 0.1152)
De p-waarde voor testen is 0,1152 .
De Fisher-exacttest gebruikt de volgende nul- en alternatieve hypothesen:
- H 0 : (nulhypothese) De twee variabelen zijn onafhankelijk.
- H 1 : (alternatieve hypothese) De twee variabelen zijn niet onafhankelijk.
Omdat deze p-waarde niet kleiner is dan 0,05, verwerpen we de nulhypothese niet.
We hebben daarom niet voldoende bewijs om te zeggen dat er een significant verband bestaat tussen geslacht en voorkeuren voor politieke partijen.
Met andere woorden: voorkeuren voor geslacht en politieke partijen zijn onafhankelijk.