Geschiktheidstest
In dit artikel wordt uitgelegd wat een goodness-of-fit-test is en waarvoor deze in de statistiek wordt gebruikt. Ook laat het zien hoe je een fittest uitvoert en daarnaast kun je stap voor stap een oefening opgelost zien.
Wat is een fittest?
De Goodness-of-Fit-test is een statistische test waarmee we kunnen bepalen of een steekproef van gegevens al dan niet in een bepaalde waarschijnlijkheidsverdeling past. Met andere woorden, de toereikendheidstoets wordt gebruikt om te controleren of de waargenomen gegevens overeenkomen met de verwachte gegevens.
Vaak proberen we voorspellingen te doen over een fenomeen en als gevolg daarvan hebben we waarden verwacht over dat fenomeen waarvan we denken dat het zal optreden. Wel moeten wij dan de gegevens verzamelen en controleren of de verzamelde gegevens aan onze verwachtingen voldoen. Met adequaatheidstesten kunnen we dus aan de hand van een statistisch criterium beslissen of de verwachte gegevens en de waargenomen gegevens al dan niet vergelijkbaar zijn.
De goodness-of-fit-test is dus een hypothesetest waarvan de nulhypothese is dat de waargenomen waarden gelijk zijn aan de verwachte waarden, aan de andere kant geeft de alternatieve hypothese van de test aan dat de waargenomen waarden statistisch verschillend zijn van de verwachte waarden.
In de statistiek wordt de goodness-of-fit-test ook wel de chikwadraattoets genoemd, omdat de referentieverdeling van de test de chikwadraatverdeling is.
Fit-testformule
De goodness-of-fit-teststatistiek is gelijk aan de som van de kwadraten van de verschillen tussen de waargenomen waarden en de verwachte waarden gedeeld door de verwachte waarden.
De formule voor de toereikendheidstoets is dus als volgt:
Goud:
-
is de goodness-of-fit-teststatistiek, die een chikwadraatverdeling volgt met
graden van vrijheid.
-
is de gegevenssteekproefgrootte.
-
is de waargenomen waarde voor gegevens i.
-
is de verwachte waarde voor gegevens i.
Dus gegeven een niveau van significantie
, moet de berekende teststatistiek worden vergeleken met de kritische testwaarde om te bepalen of de nulhypothese of de alternatieve hypothese van de hypothesetest moet worden verworpen:
- Als de teststatistiek kleiner is dan de kritische waarde
, wordt de alternatieve hypothese verworpen (en wordt de nulhypothese aanvaard).
- Als de teststatistiek groter is dan de kritische waarde
, wordt de nulhypothese verworpen (en wordt de alternatieve hypothese geaccepteerd).
Hoe doe je een fittest?
Om een geschiktheidstest uit te voeren, moeten de volgende stappen worden gevolgd:
- We stellen eerst de nulhypothese en de alternatieve hypothese van de goodness-of-fit-test vast.
- Ten tweede kiezen we het betrouwbaarheidsniveau , en dus het significantieniveau , van de goodness-of-fit-test.
- Vervolgens berekenen we de goodness-of-fit-teststatistiek, waarvan u de formule in het bovenstaande gedeelte kunt vinden.
- We vinden de kritische waarde van de goodness-of-fit-test met behulp van de chikwadraatverdelingstabel.
- We vergelijken de teststatistiek met de kritische waarde:
- Als de teststatistiek kleiner is dan de kritische waarde, wordt de alternatieve hypothese verworpen (en wordt de nulhypothese geaccepteerd).
- Als de teststatistiek groter is dan de kritische waarde, wordt de nulhypothese verworpen (en wordt de alternatieve hypothese geaccepteerd).
Voorbeeld van een toereikendheidstoets
- Een winkeleigenaar zegt dat 50% van haar omzet voor product A is, 35% van haar omzet voor product B en 15% van haar omzet voor product C. De verkochte eenheden van elk product zijn echter de eenheden die worden weergegeven in de volgende tabel. Analyseer of de theoretische gegevens van de eigenaar statistisch verschillen van de feitelijk verzamelde gegevens.
Product | Waargenomen omzet (O i ) |
---|---|
Product A | 453 |
Product B | 268 |
Product C | 79 |
Totaal | 800 |
Om te bepalen of de waargenomen waarden gelijkwaardig zijn aan de verwachte waarden, zullen wij een goodness-of-fit test uitvoeren. De nulhypothese en alternatieve hypothese van de test zijn:
In dit geval gebruiken we een betrouwbaarheidsniveau van 95% voor de test, dus het significantieniveau is 5%.
Om de verwachte verkoopwaarden te vinden, moeten we het percentage van de verwachte verkopen van elk product vermenigvuldigen met het aantal totale verkopen:
Daarom is de probleemfrequentietabel als volgt:
Product | Waargenomen omzet (O i ) | Verwachte omzet (E i ) |
---|---|---|
Product A | 453 | 400 |
Product B | 268 | 280 |
Product C | 79 | 120 |
Totaal | 800 | 800 |
Nu we alle waarden hebben berekend, passen we de chikwadraat-testformule toe om de teststatistiek te berekenen:
Zodra de waarde van de teststatistiek is berekend, gebruiken we de chikwadraatverdelingstabel om de kritische waarde van de test te vinden. De chikwadraatverdeling heeft
vrijheidsgraden en het significantieniveau zijn
,Nog:
De teststatistiek (21,53) is dus groter dan de kritische testwaarde (5,991), daarom wordt de nulhypothese verworpen en wordt de alternatieve hypothese geaccepteerd. Dit betekent dat de gegevens heel anders zijn en dat de winkeleigenaar daarom een andere omzet verwachtte dan er daadwerkelijk werd gerealiseerd.
Über den Autor
Dr.benjamin anderson
Ik ben Benjamin, een gepensioneerde hoogleraar statistiek die nu een toegewijde Statorials-lesgever is. Ik heb uitgebreide ervaring en expertise op het gebied van statistiek en ik ben vastbesloten om mijn kennis te delen met studenten via Statorials. Lees verder