Geschiktheidstest

Von Dr.benjamin anderson August 2, 2023 Statistieken Keine Kommentare

In dit artikel wordt uitgelegd wat een goodness-of-fit-test is en waarvoor deze in de statistiek wordt gebruikt. Ook laat het zien hoe je een fittest uitvoert en daarnaast kun je stap voor stap een oefening opgelost zien.

Wat is een fittest?

De Goodness-of-Fit-test is een statistische test waarmee we kunnen bepalen of een steekproef van gegevens al dan niet in een bepaalde waarschijnlijkheidsverdeling past. Met andere woorden, de toereikendheidstoets wordt gebruikt om te controleren of de waargenomen gegevens overeenkomen met de verwachte gegevens.

Vaak proberen we voorspellingen te doen over een fenomeen en als gevolg daarvan hebben we waarden verwacht over dat fenomeen waarvan we denken dat het zal optreden. Wel moeten wij dan de gegevens verzamelen en controleren of de verzamelde gegevens aan onze verwachtingen voldoen. Met adequaatheidstesten kunnen we dus aan de hand van een statistisch criterium beslissen of de verwachte gegevens en de waargenomen gegevens al dan niet vergelijkbaar zijn.

De goodness-of-fit-test is dus een hypothesetest waarvan de nulhypothese is dat de waargenomen waarden gelijk zijn aan de verwachte waarden, aan de andere kant geeft de alternatieve hypothese van de test aan dat de waargenomen waarden statistisch verschillend zijn van de verwachte waarden.

$\begin{cases}H_0: f(x)=f_o(x)\\[2ex]H_1: f(x)\neq f_o(x)\end{cases}$

In de statistiek wordt de goodness-of-fit-test ook wel de chikwadraattoets genoemd, omdat de referentieverdeling van de test de chikwadraatverdeling is.

Fit-testformule

De goodness-of-fit-teststatistiek is gelijk aan de som van de kwadraten van de verschillen tussen de waargenomen waarden en de verwachte waarden gedeeld door de verwachte waarden.

De formule voor de toereikendheidstoets is dus als volgt:

$\displaystyle\chi^2=\sum_{i=1}^k\frac{(O_i-E_i)^2}{E_i}$

Goud:

$\chi^2$

is de goodness-of-fit-teststatistiek, die een chikwadraatverdeling volgt met

$k-1$

graden van vrijheid.
$k$

is de gegevenssteekproefgrootte.
$O_i$

is de waargenomen waarde voor gegevens i.
$E_i$

is de verwachte waarde voor gegevens i.

Dus gegeven een niveau van significantie

$\alpha$

, moet de berekende teststatistiek worden vergeleken met de kritische testwaarde om te bepalen of de nulhypothese of de alternatieve hypothese van de hypothesetest moet worden verworpen:

Als de teststatistiek kleiner is dan de kritische waarde
$\chi_{1-\alpha|k-1}^2$

, wordt de alternatieve hypothese verworpen (en wordt de nulhypothese aanvaard).
Als de teststatistiek groter is dan de kritische waarde
$\chi_{1-\alpha|k-1}^2$

, wordt de nulhypothese verworpen (en wordt de alternatieve hypothese geaccepteerd).

$\begin{array}{l}\text{Si } \chi^2<\chi^2_{1-\alpha|k-1}\text{ se rechaza } H_1\\[3ex]\text{Si } \chi^2>\chi^2_{1-\alpha|k-1}\text{ se rechaza } H_0\end{array}“ title=“Rendered by QuickLaTeX.com“ height=“70″ width=“243″ style=“vertical-align: 0px;“></p> </p> <h2 class=$ Hoe doe je een fittest?

Om een geschiktheidstest uit te voeren, moeten de volgende stappen worden gevolgd:

We stellen eerst de nulhypothese en de alternatieve hypothese van de goodness-of-fit-test vast.
Ten tweede kiezen we het betrouwbaarheidsniveau , en dus het significantieniveau , van de goodness-of-fit-test.
Vervolgens berekenen we de goodness-of-fit-teststatistiek, waarvan u de formule in het bovenstaande gedeelte kunt vinden.
We vinden de kritische waarde van de goodness-of-fit-test met behulp van de chikwadraatverdelingstabel.
We vergelijken de teststatistiek met de kritische waarde:
- Als de teststatistiek kleiner is dan de kritische waarde, wordt de alternatieve hypothese verworpen (en wordt de nulhypothese geaccepteerd).
- Als de teststatistiek groter is dan de kritische waarde, wordt de nulhypothese verworpen (en wordt de alternatieve hypothese geaccepteerd).

Voorbeeld van een toereikendheidstoets

Een winkeleigenaar zegt dat 50% van haar omzet voor product A is, 35% van haar omzet voor product B en 15% van haar omzet voor product C. De verkochte eenheden van elk product zijn echter de eenheden die worden weergegeven in de volgende tabel. Analyseer of de theoretische gegevens van de eigenaar statistisch verschillen van de feitelijk verzamelde gegevens.

Product	Waargenomen omzet (O _i )
Product A	453
Product B	268
Product C	79
Totaal	800

Om te bepalen of de waargenomen waarden gelijkwaardig zijn aan de verwachte waarden, zullen wij een goodness-of-fit test uitvoeren. De nulhypothese en alternatieve hypothese van de test zijn:

$\begin{cases}H_0: f(x)=f_o(x)\\[2ex]H_1: f(x)\neq f_o(x)\end{cases}$

In dit geval gebruiken we een betrouwbaarheidsniveau van 95% voor de test, dus het significantieniveau is 5%.

$\alpha=0,05$

Om de verwachte verkoopwaarden te vinden, moeten we het percentage van de verwachte verkopen van elk product vermenigvuldigen met het aantal totale verkopen:

$\begin{array}{c}E_A=800\cdot 0,50=400\\[2ex]E_B=800\cdot 0,35=280\\[2ex]E_A=800\cdot 0,15=120\end{array}$

Daarom is de probleemfrequentietabel als volgt:

Product	Waargenomen omzet (O _i )	Verwachte omzet (E _i )
Product A	453	400
Product B	268	280
Product C	79	120
Totaal	800	800

Nu we alle waarden hebben berekend, passen we de chikwadraat-testformule toe om de teststatistiek te berekenen:

$\begin{array}{c}\displaystyle\chi^2=\sum_{i=1}^k\frac{(O_i-E_i)^2}{E_i}\\[6ex]\chi^2=\cfrac{(453-400)^2}{400}+\cfrac{(268-280)^2}{280}+\cfrac{(79-120)^2}{120}\\[6ex]\chi^2=7,02+0,51+14,00\\[6ex]\chi^2=21,53\end{array}$

Zodra de waarde van de teststatistiek is berekend, gebruiken we de chikwadraatverdelingstabel om de kritische waarde van de test te vinden. De chikwadraatverdeling heeft

$k-1=3-1=2$

vrijheidsgraden en het significantieniveau zijn

$\alpha=0,05$

,Nog:

$\begin{array}{c}\chi^2_{1-\alpha|k-1}=\ \color{orange}\bm{?}\color{black}\\[4ex]\chi^2_{0,95|2}=5,991\end{array}$

De teststatistiek (21,53) is dus groter dan de kritische testwaarde (5,991), daarom wordt de nulhypothese verworpen en wordt de alternatieve hypothese geaccepteerd. Dit betekent dat de gegevens heel anders zijn en dat de winkeleigenaar daarom een andere omzet verwachtte dan er daadwerkelijk werd gerealiseerd.

$21,53>5,991 \ \color{orange}\bm{\longrightarrow}\color{black} \ \text{Se rechaza } H_0″ title=“Rendered by QuickLaTeX.com“ height=“17″ width=“354″ style=“vertical-align: -4px;“></p></p> </div>  <div class=$

Über den Autor

Dr.benjamin anderson

Ik ben Benjamin, een gepensioneerde hoogleraar statistiek die nu een toegewijde Statorials-lesgever is. Ik heb uitgebreide ervaring en expertise op het gebied van statistiek en ik ben vastbesloten om mijn kennis te delen met studenten via Statorials. Lees verder

Wat is een fittest?

Fit-testformule

Voorbeeld van een toereikendheidstoets

Über den Autor

Dr.benjamin anderson

Einen Kommentar hinzufügen