Geschiktheidstest

In dit artikel wordt uitgelegd wat een goodness-of-fit-test is en waarvoor deze in de statistiek wordt gebruikt. Ook laat het zien hoe je een fittest uitvoert en daarnaast kun je stap voor stap een oefening opgelost zien.

Wat is een fittest?

De Goodness-of-Fit-test is een statistische test waarmee we kunnen bepalen of een steekproef van gegevens al dan niet in een bepaalde waarschijnlijkheidsverdeling past. Met andere woorden, de toereikendheidstoets wordt gebruikt om te controleren of de waargenomen gegevens overeenkomen met de verwachte gegevens.

Vaak proberen we voorspellingen te doen over een fenomeen en als gevolg daarvan hebben we waarden verwacht over dat fenomeen waarvan we denken dat het zal optreden. Wel moeten wij dan de gegevens verzamelen en controleren of de verzamelde gegevens aan onze verwachtingen voldoen. Met adequaatheidstesten kunnen we dus aan de hand van een statistisch criterium beslissen of de verwachte gegevens en de waargenomen gegevens al dan niet vergelijkbaar zijn.

De goodness-of-fit-test is dus een hypothesetest waarvan de nulhypothese is dat de waargenomen waarden gelijk zijn aan de verwachte waarden, aan de andere kant geeft de alternatieve hypothese van de test aan dat de waargenomen waarden statistisch verschillend zijn van de verwachte waarden.

\begin{cases}H_0: f(x)=f_o(x)\\[2ex]H_1: f(x)\neq f_o(x)\end{cases}

In de statistiek wordt de goodness-of-fit-test ook wel de chikwadraattoets genoemd, omdat de referentieverdeling van de test de chikwadraatverdeling is.

Fit-testformule

De goodness-of-fit-teststatistiek is gelijk aan de som van de kwadraten van de verschillen tussen de waargenomen waarden en de verwachte waarden gedeeld door de verwachte waarden.

De formule voor de toereikendheidstoets is dus als volgt:

\displaystyle\chi^2=\sum_{i=1}^k\frac{(O_i-E_i)^2}{E_i}

Goud:

  • \chi^2

    is de goodness-of-fit-teststatistiek, die een chikwadraatverdeling volgt met

    k-1

    graden van vrijheid.

  • k

    is de gegevenssteekproefgrootte.

  • O_i

    is de waargenomen waarde voor gegevens i.

  • E_i

    is de verwachte waarde voor gegevens i.

Dus gegeven een niveau van significantie

\alpha

, moet de berekende teststatistiek worden vergeleken met de kritische testwaarde om te bepalen of de nulhypothese of de alternatieve hypothese van de hypothesetest moet worden verworpen:

  • Als de teststatistiek kleiner is dan de kritische waarde

    \chi_{1-\alpha|k-1}^2

    , wordt de alternatieve hypothese verworpen (en wordt de nulhypothese aanvaard).

  • Als de teststatistiek groter is dan de kritische waarde

    \chi_{1-\alpha|k-1}^2

    , wordt de nulhypothese verworpen (en wordt de alternatieve hypothese geaccepteerd).

\begin{array}{l}\text{Si } \chi^2<\chi^2_{1-\alpha|k-1}\text{ se rechaza } H_1\\[3ex]\text{Si } \chi^2>\chi^2_{1-\alpha|k-1}\text{ se rechaza } H_0\end{array}“ title=“Rendered by QuickLaTeX.com“ height=“70″ width=“243″ style=“vertical-align: 0px;“></p>
</p>
<h2 class= Hoe doe je een fittest?

Om een geschiktheidstest uit te voeren, moeten de volgende stappen worden gevolgd:

  1. We stellen eerst de nulhypothese en de alternatieve hypothese van de goodness-of-fit-test vast.
  2. Ten tweede kiezen we het betrouwbaarheidsniveau , en dus het significantieniveau , van de goodness-of-fit-test.
  3. Vervolgens berekenen we de goodness-of-fit-teststatistiek, waarvan u de formule in het bovenstaande gedeelte kunt vinden.
  4. We vinden de kritische waarde van de goodness-of-fit-test met behulp van de chikwadraatverdelingstabel.
  5. We vergelijken de teststatistiek met de kritische waarde:
    • Als de teststatistiek kleiner is dan de kritische waarde, wordt de alternatieve hypothese verworpen (en wordt de nulhypothese geaccepteerd).
    • Als de teststatistiek groter is dan de kritische waarde, wordt de nulhypothese verworpen (en wordt de alternatieve hypothese geaccepteerd).

Voorbeeld van een toereikendheidstoets

  • Een winkeleigenaar zegt dat 50% van haar omzet voor product A is, 35% van haar omzet voor product B en 15% van haar omzet voor product C. De verkochte eenheden van elk product zijn echter de eenheden die worden weergegeven in de volgende tabel. Analyseer of de theoretische gegevens van de eigenaar statistisch verschillen van de feitelijk verzamelde gegevens.
Product Waargenomen omzet (O i )
Product A 453
Product B 268
Product C 79
Totaal 800

Om te bepalen of de waargenomen waarden gelijkwaardig zijn aan de verwachte waarden, zullen wij een goodness-of-fit test uitvoeren. De nulhypothese en alternatieve hypothese van de test zijn:

\begin{cases}H_0: f(x)=f_o(x)\\[2ex]H_1: f(x)\neq f_o(x)\end{cases}

In dit geval gebruiken we een betrouwbaarheidsniveau van 95% voor de test, dus het significantieniveau is 5%.

\alpha=0,05

Om de verwachte verkoopwaarden te vinden, moeten we het percentage van de verwachte verkopen van elk product vermenigvuldigen met het aantal totale verkopen:

\begin{array}{c}E_A=800\cdot 0,50=400\\[2ex]E_B=800\cdot 0,35=280\\[2ex]E_A=800\cdot 0,15=120\end{array}

Daarom is de probleemfrequentietabel als volgt:

Product Waargenomen omzet (O i ) Verwachte omzet (E i )
Product A 453 400
Product B 268 280
Product C 79 120
Totaal 800 800

Nu we alle waarden hebben berekend, passen we de chikwadraat-testformule toe om de teststatistiek te berekenen:

\begin{array}{c}\displaystyle\chi^2=\sum_{i=1}^k\frac{(O_i-E_i)^2}{E_i}\\[6ex]\chi^2=\cfrac{(453-400)^2}{400}+\cfrac{(268-280)^2}{280}+\cfrac{(79-120)^2}{120}\\[6ex]\chi^2=7,02+0,51+14,00\\[6ex]\chi^2=21,53\end{array}

Zodra de waarde van de teststatistiek is berekend, gebruiken we de chikwadraatverdelingstabel om de kritische waarde van de test te vinden. De chikwadraatverdeling heeft

k-1=3-1=2

vrijheidsgraden en het significantieniveau zijn

\alpha=0,05

,Nog:

\begin{array}{c}\chi^2_{1-\alpha|k-1}=\ \color{orange}\bm{?}\color{black}\\[4ex]\chi^2_{0,95|2}=5,991\end{array}

De teststatistiek (21,53) is dus groter dan de kritische testwaarde (5,991), daarom wordt de nulhypothese verworpen en wordt de alternatieve hypothese geaccepteerd. Dit betekent dat de gegevens heel anders zijn en dat de winkeleigenaar daarom een andere omzet verwachtte dan er daadwerkelijk werd gerealiseerd.

21,53>5,991 \ \color{orange}\bm{\longrightarrow}\color{black} \ \text{Se rechaza } H_0″ title=“Rendered by QuickLaTeX.com“ height=“17″ width=“354″ style=“vertical-align: -4px;“></p></p>
								</div><!-- End Content -->

																	<!-- Start Author Box -->
									<div class=

Über den Autor

Dr.benjamin anderson
Dr.benjamin anderson

Ik ben Benjamin, een gepensioneerde hoogleraar statistiek die nu een toegewijde Statorials-lesgever is. Ik heb uitgebreide ervaring en expertise op het gebied van statistiek en ik ben vastbesloten om mijn kennis te delen met studenten via Statorials. Lees verder

Einen Kommentar hinzufügen

Deine E-Mail-Adresse wird nicht veröffentlicht. Erforderliche Felder sind mit * markiert