Chikwadraattoets

In dit artikel wordt uitgelegd wat de chikwadraattoets in de statistiek is en waarvoor deze wordt gebruikt. Ook ontdek je hoe je een chikwadraattoets maakt en daarnaast een stapsgewijs opgeloste oefening.

Wat is de chikwadraattoets?

De Chi-kwadraattoets is een statistische toets die wordt gebruikt om te bepalen of er een statistisch significant verschil bestaat tussen de verwachte frequentie en de waargenomen frequentie.

Logischerwijs volgt de chikwadraattoetsstatistiek een chikwadraatverdeling . De waarde van de teststatistiek moet daarom worden vergeleken met een bepaalde waarde van de chikwadraatverdeling. Hieronder zullen we zien hoe de chikwadraattest wordt uitgevoerd.

Dit type statistische toets staat ook bekend als de Pearson chikwadraattoets en wordt soms weergegeven door het symbool voor de chikwadraatverdeling: χ²-toets .

Chikwadraat-testformule

De chikwadraattoetsstatistiek is gelijk aan de som van de kwadraten van de verschillen tussen de waargenomen waarden en de verwachte waarden gedeeld door de verwachte waarden.

De formule voor de chikwadraattoets is dus:

\displaystyle\chi^2=\sum_{i=1}^k\frac{(O_i-E_i)^2}{E_i}

Goud:

  • \chi^2

    is de chikwadraattoetsstatistiek, die een chikwadraatverdeling volgt met

    k-1

    graden van vrijheid.

  • k

    is de gegevenssteekproefgrootte.

  • O_i

    is de waargenomen waarde voor gegevens i.

  • E_i

    is de verwachte waarde voor gegevens i.

De nulhypothese van het testen van een chikwadraattoets is dat de waargenomen waarden gelijkwaardig zijn aan de verwachte waarden. Aan de andere kant is de alternatieve hypothese van de test dat een van de waargenomen waarden verschilt van de verwachte waarde.

\begin{cases}H_0:O_i=E_i \quad \forall i\\[2ex]H_1:\exists \ O_i\neq E_i \end{cases}

Dus, gegeven een niveau van significantie

\alpha

, moet de berekende teststatistiek worden vergeleken met de kritische testwaarde om te bepalen of de nulhypothese of de alternatieve hypothese moet worden verworpen:

  • Als de teststatistiek kleiner is dan de kritische waarde

    \chi_{1-\alpha|k-1}^2

    , wordt de alternatieve hypothese verworpen (en wordt de nulhypothese geaccepteerd).

  • Als de teststatistiek groter is dan de kritische waarde

    \chi_{1-\alpha|k-1}^2

    , wordt de nulhypothese verworpen (en wordt de alternatieve hypothese geaccepteerd).

\begin{array}{l}\text{Si } \chi^2<\chi^2_{1-\alpha|k-1}\text{ se rechaza } H_1\\[3ex]\text{Si } \chi^2>\chi^2_{1-\alpha|k-1}\text{ se rechaza } H_0\end{array}“ title=“Rendered by QuickLaTeX.com“ height=“70″ width=“243″ style=“vertical-align: 0px;“></p>
</p>
<h2 class= Voorbeeld van de chikwadraattoets

Zodra we de definitie van de chikwadraattoets hebben gezien en wat de formule ervan is, wordt hieronder een stapsgewijs opgelost voorbeeld weergegeven, zodat u kunt zien hoe dit type statistische toetsing wordt uitgevoerd.

  • Een winkeleigenaar zegt dat 50% van zijn omzet voor product A is, 35% van zijn omzet voor product B en 15% van zijn omzet voor product C. De verkochte eenheden van elk product zijn echter de eenheden waarin ze worden gepresenteerd in de volgende kruistabel . Analyseer of de theoretische gegevens van de eigenaar statistisch verschillen van de feitelijk verzamelde gegevens.
Product Waargenomen omzet (O i )
Product A 453
Product B 268
Product C 79
Totaal 800

Eerst moeten we de door de winkeleigenaar verwachte waarden berekenen. Om dit te doen, vermenigvuldigen we het percentage van de verwachte omzet van elk product met het totaal aantal behaalde verkopen:

\begin{array}{c}E_A=800\cdot 0,5=400\\[2ex]E_B=800\cdot 0,35=280\\[2ex]E_A=800\cdot 0,15=120\end{array}

Daarom is de frequentieverdelingstabel van het probleem als volgt:

Product Waargenomen omzet (O i ) Verwachte omzet (E i )
Product A 453 400
Product B 268 280
Product C 79 120
Totaal 800 800

Nu we alle waarden hebben berekend, passen we de chikwadraat-testformule toe om de teststatistiek te berekenen:

\begin{array}{c}\displaystyle\chi^2=\sum_{i=1}^k\frac{(O_i-E_i)^2}{E_i}\\[6ex]\chi^2=\cfrac{(453-400)^2}{400}+\cfrac{(268-280)^2}{280}+\cfrac{(79-120)^2}{120}\\[6ex]\chi^2=7,02+0,51+14,00\\[6ex]\chi^2=21,53\end{array}

Zodra de waarde van de teststatistiek is berekend, gebruiken we de chikwadraatverdelingstabel om de kritische waarde van de test te vinden. De chikwadraatverdeling heeft

k-1=3-1=2

vrijheidsgraden, dus als we een significantieniveau kiezen

\alpha=0,05

de kritische waarde van de test is als volgt:

\begin{array}{c}\chi^2_{1-\alpha|k-1}=\ \color{orange}\bm{?}\color{black}\\[4ex]\chi^2_{0,95|2}=5,991\end{array}

De teststatistiek (21,53) is dus groter dan de kritische testwaarde (5,991), daarom wordt de nulhypothese verworpen en wordt de alternatieve hypothese geaccepteerd. Dit betekent dat de gegevens heel anders zijn en dat de winkeleigenaar daarom een andere omzet verwachtte dan er daadwerkelijk werd gerealiseerd.

21,53>5,991 \ \color{orange}\bm{\longrightarrow}\color{black} \ \text{Se rechaza } H_0″ title=“Rendered by QuickLaTeX.com“ height=“17″ width=“354″ style=“vertical-align: -4px;“></p>
</p>
<h2 class= Interpretatie van de chikwadraattoets

De interpretatie van de Chi-kwadraattoets kan niet uitsluitend plaatsvinden op basis van het verkregen testresultaat, maar moet worden vergeleken met de kritische waarde van de toets.

Logischerwijs geldt dat hoe kleiner de waarde van de berekende teststatistiek is, des te meer de waargenomen gegevens overeenkomen met de verwachte gegevens. Dus als het chikwadraattestresultaat 0 is, betekent dit dat de waargenomen waarden en de verwachte waarden exact hetzelfde zijn. Aan de andere kant, hoe groter het testresultaat, dit betekent dat hoe meer de waargenomen waarden afwijken van de verwachte waarden.

Om echter te beslissen of de twee datasets statistisch verschillend of gelijk zijn, moet men de berekende testwaarde vergelijken met de kritische testwaarde, om de nulhypothese of de alternatieve hypothese van het contrast te verwerpen. Als de teststatistiek kleiner is dan de kritische waarde van de verdeling, wordt de alternatieve hypothese verworpen. Aan de andere kant, als de teststatistiek groter is dan de kritische waarde van de verdeling, wordt de nulhypothese verworpen.

Einen Kommentar hinzufügen

Deine E-Mail-Adresse wird nicht veröffentlicht. Erforderliche Felder sind mit * markiert