Chi-kwadraat-onafhankelijkheidstest: definitie, formule en voorbeeld
Een chikwadraattest voor onafhankelijkheid wordt gebruikt om te bepalen of er al dan niet een significant verband bestaat tussen twee categorische variabelen.
In deze zelfstudie wordt het volgende uitgelegd:
- De motivatie om een chikwadraattest van onafhankelijkheid uit te voeren.
- De formule voor het uitvoeren van een chikwadraattest van onafhankelijkheid.
- Een voorbeeld van hoe u een chikwadraattest van onafhankelijkheid uitvoert.
Chi-kwadraat onafhankelijkheidstest: motivatie
Een Chi-kwadraattest voor onafhankelijkheid kan worden gebruikt om te bepalen of er een verband bestaat tussen twee categorische variabelen in veel verschillende contexten. Hier zijn enkele voorbeelden:
- We willen weten of gender verband houdt met de voorkeur voor een politieke partij. Daarom ondervragen we 500 kiezers en registreren we hun voorkeur voor geslacht en politieke partij.
- We willen weten of de favoriete kleur van een persoon verband houdt met zijn favoriete sport. Daarom ondervragen we 100 mensen en vragen hen wat hun voorkeuren zijn voor beide.
- Wij willen weten of opleidingsniveau en burgerlijke staat met elkaar samenhangen. Daarom verzamelen we gegevens over deze twee variabelen op een eenvoudige willekeurige steekproef van 50 personen.
In elk van deze scenario’s willen we weten of twee categorische variabelen met elkaar geassocieerd zijn. In elk scenario kunnen we een Chi-kwadraattest van onafhankelijkheid gebruiken om te bepalen of er een statistisch significant verband bestaat tussen de variabelen.
Chi-kwadraat-onafhankelijkheidstest: formule
Een chikwadraattest van onafhankelijkheid maakt gebruik van de volgende nul- en alternatieve hypothesen:
- H 0 : (nulhypothese) De twee variabelen zijn onafhankelijk.
- H 1 : (alternatieve hypothese) De twee variabelen zijn niet onafhankelijk. (dwz ze zijn geassocieerd)
We gebruiken de volgende formule om de Chi-kwadraat x 2- teststatistiek te berekenen:
X 2 = Σ(OE) 2 / E
Goud:
- Σ: is een mooi symbool dat “som” betekent
- O: waargenomen waarde
- E: verwachte waarde
Als de p-waarde die overeenkomt met de teststatistiek X 2 met (#rows-1)*(#columns-1) vrijheidsgraden kleiner is dan het gekozen significantieniveau, dan kun je de nulhypothese verwerpen.
Chikwadraat-onafhankelijkheidstest: voorbeeld
Stel dat we willen weten of gender wel of niet geassocieerd is met de voorkeur voor een politieke partij. We nemen een eenvoudige willekeurige steekproef van 500 kiezers en vragen hen naar hun politieke partijvoorkeur. De volgende tabel geeft de resultaten van het onderzoek weer:
Republikeins | Democraat | Onafhankelijk | Totaal | |
Mannelijk | 120 | 90 | 40 | 250 |
Vrouwelijk | 110 | 95 | 45 | 250 |
Totaal | 230 | 185 | 85 | 500 |
Gebruik de volgende stappen om een chikwadraattest van onafhankelijkheid uit te voeren om te bepalen of geslacht verband houdt met de voorkeur voor politieke partijen.
Stap 1: Definieer aannames.
We zullen de Chi-kwadraattest van onafhankelijkheid uitvoeren met behulp van de volgende aannames:
- H 0 : Voorkeuren voor geslacht en politieke partijen zijn onafhankelijk.
- H 1 : Voorkeuren voor geslacht en politieke partijen zijn niet onafhankelijk.
Stap 2: Bereken de verwachte waarden.
Vervolgens berekenen we de verwachte waarden voor elke cel in de kruistabel met behulp van de volgende formule:
Verwachte waarde = (som van rijen * som van kolommen) / som van tabel.
De verwachte waarde voor Republikeinse mannen is bijvoorbeeld: (230*250) / 500 = 115 .
We kunnen deze formule herhalen om de verwachte waarde voor elke tabelcel te krijgen:
Republikeins | Democraat | Onafhankelijk | Totaal | |
Mannelijk | 115 | 92,5 | 42,5 | 250 |
Vrouwelijk | 115 | 92,5 | 42,5 | 250 |
Totaal | 230 | 185 | 85 | 500 |
Stap 3: Bereken (OE) 2 /E voor elke cel in de tabel.
Vervolgens berekenen we (OE) 2 /E voor elke cel in de tabel, waarbij:
- O: waargenomen waarde
- E: verwachte waarde
Mannelijke Republikeinen zouden bijvoorbeeld een waarde hebben van: (120-115) 2 /115 = 0,2174 .
We kunnen deze formule herhalen voor elke cel in de tabel:
Republikeins | Democraat | Onafhankelijk | |
Mannelijk | 0,2174 | 0,0676 | 0,1471 |
Vrouwelijk | 0,2174 | 0,0676 | 0,1471 |
Stap 4: Bereken de teststatistiek X2 en de bijbehorende p-waarde.
X 2 = σ (OE) 2 / E = 0,2174 + 0,2174 + 0,0676 + 0,0676 + 0,1471 + 0,1471 = 0,8642
Volgens de chikwadraatscorecalculator voor P-waarde is de p-waarde geassocieerd met X 2 = 0,8642 en (2-1)*(3-1) = 2 vrijheidsgraden 0,649198 .
Stap 5: Trek een conclusie.
Omdat deze p-waarde niet kleiner is dan 0,05, slagen we er niet in de nulhypothese te verwerpen. Dit betekent dat we niet voldoende bewijs hebben om te zeggen dat er een verband bestaat tussen geslacht en politieke partijvoorkeuren.
Opmerking: u kunt deze hele test ook uitvoeren door eenvoudigweg de Chi-Square Independence Test Calculator te gebruiken.
Aanvullende bronnen
In de volgende tutorials wordt uitgelegd hoe u een chi-kwadraattest van onafhankelijkheid kunt uitvoeren met behulp van verschillende statistische programma’s:
Hoe voer je een chi-kwadraattest van onafhankelijkheid uit in Stata?
Hoe u een Chi-Square-onafhankelijkheidstest uitvoert in Excel
Hoe u een Chi-kwadraat-onafhankelijkheidstest uitvoert in SPSS
Hoe u een Chi-Square-onafhankelijkheidstest uitvoert in Python
Hoe voer je een chi-kwadraat-onafhankelijkheidstest uit in R
Chikwadraat-onafhankelijkheidstest op een TI-84-rekenmachine
Chi-kwadraattest van de onafhankelijkheidscalculator