Chikwadraattoets
In dit artikel wordt uitgelegd wat de chikwadraattoets in de statistiek is en waarvoor deze wordt gebruikt. Ook ontdek je hoe je een chikwadraattoets maakt en daarnaast een stapsgewijs opgeloste oefening.
Wat is de chikwadraattoets?
De Chi-kwadraattoets is een statistische toets die wordt gebruikt om te bepalen of er een statistisch significant verschil bestaat tussen de verwachte frequentie en de waargenomen frequentie.
Logischerwijs volgt de chikwadraattoetsstatistiek een chikwadraatverdeling . De waarde van de teststatistiek moet daarom worden vergeleken met een bepaalde waarde van de chikwadraatverdeling. Hieronder zullen we zien hoe de chikwadraattest wordt uitgevoerd.
Dit type statistische toets staat ook bekend als de Pearson chikwadraattoets en wordt soms weergegeven door het symbool voor de chikwadraatverdeling: χ²-toets .
Chikwadraat-testformule
De chikwadraattoetsstatistiek is gelijk aan de som van de kwadraten van de verschillen tussen de waargenomen waarden en de verwachte waarden gedeeld door de verwachte waarden.
De formule voor de chikwadraattoets is dus:
Goud:
-
is de chikwadraattoetsstatistiek, die een chikwadraatverdeling volgt met
graden van vrijheid.
-
is de gegevenssteekproefgrootte.
-
is de waargenomen waarde voor gegevens i.
-
is de verwachte waarde voor gegevens i.
De nulhypothese van het testen van een chikwadraattoets is dat de waargenomen waarden gelijkwaardig zijn aan de verwachte waarden. Aan de andere kant is de alternatieve hypothese van de test dat een van de waargenomen waarden verschilt van de verwachte waarde.
Dus, gegeven een niveau van significantie
, moet de berekende teststatistiek worden vergeleken met de kritische testwaarde om te bepalen of de nulhypothese of de alternatieve hypothese moet worden verworpen:
- Als de teststatistiek kleiner is dan de kritische waarde
, wordt de alternatieve hypothese verworpen (en wordt de nulhypothese geaccepteerd).
- Als de teststatistiek groter is dan de kritische waarde
, wordt de nulhypothese verworpen (en wordt de alternatieve hypothese geaccepteerd).
Voorbeeld van de chikwadraattoets
Zodra we de definitie van de chikwadraattoets hebben gezien en wat de formule ervan is, wordt hieronder een stapsgewijs opgelost voorbeeld weergegeven, zodat u kunt zien hoe dit type statistische toetsing wordt uitgevoerd.
- Een winkeleigenaar zegt dat 50% van zijn omzet voor product A is, 35% van zijn omzet voor product B en 15% van zijn omzet voor product C. De verkochte eenheden van elk product zijn echter de eenheden waarin ze worden gepresenteerd in de volgende kruistabel . Analyseer of de theoretische gegevens van de eigenaar statistisch verschillen van de feitelijk verzamelde gegevens.
Product | Waargenomen omzet (O i ) |
---|---|
Product A | 453 |
Product B | 268 |
Product C | 79 |
Totaal | 800 |
Eerst moeten we de door de winkeleigenaar verwachte waarden berekenen. Om dit te doen, vermenigvuldigen we het percentage van de verwachte omzet van elk product met het totaal aantal behaalde verkopen:
Daarom is de frequentieverdelingstabel van het probleem als volgt:
Product | Waargenomen omzet (O i ) | Verwachte omzet (E i ) |
---|---|---|
Product A | 453 | 400 |
Product B | 268 | 280 |
Product C | 79 | 120 |
Totaal | 800 | 800 |
Nu we alle waarden hebben berekend, passen we de chikwadraat-testformule toe om de teststatistiek te berekenen:
Zodra de waarde van de teststatistiek is berekend, gebruiken we de chikwadraatverdelingstabel om de kritische waarde van de test te vinden. De chikwadraatverdeling heeft
vrijheidsgraden, dus als we een significantieniveau kiezen
de kritische waarde van de test is als volgt:
De teststatistiek (21,53) is dus groter dan de kritische testwaarde (5,991), daarom wordt de nulhypothese verworpen en wordt de alternatieve hypothese geaccepteerd. Dit betekent dat de gegevens heel anders zijn en dat de winkeleigenaar daarom een andere omzet verwachtte dan er daadwerkelijk werd gerealiseerd.
Interpretatie van de chikwadraattoets
De interpretatie van de Chi-kwadraattoets kan niet uitsluitend plaatsvinden op basis van het verkregen testresultaat, maar moet worden vergeleken met de kritische waarde van de toets.
Logischerwijs geldt dat hoe kleiner de waarde van de berekende teststatistiek is, des te meer de waargenomen gegevens overeenkomen met de verwachte gegevens. Dus als het chikwadraattestresultaat 0 is, betekent dit dat de waargenomen waarden en de verwachte waarden exact hetzelfde zijn. Aan de andere kant, hoe groter het testresultaat, dit betekent dat hoe meer de waargenomen waarden afwijken van de verwachte waarden.
Om echter te beslissen of de twee datasets statistisch verschillend of gelijk zijn, moet men de berekende testwaarde vergelijken met de kritische testwaarde, om de nulhypothese of de alternatieve hypothese van het contrast te verwerpen. Als de teststatistiek kleiner is dan de kritische waarde van de verdeling, wordt de alternatieve hypothese verworpen. Aan de andere kant, als de teststatistiek groter is dan de kritische waarde van de verdeling, wordt de nulhypothese verworpen.