Een normaliteitstest uitvoeren in excel (stap voor stap)
Veel statistische tests gaan ervan uit dat de waarden in een dataset normaal verdeeld zijn.
Een van de eenvoudigste manieren om deze hypothese te testen is door een Jarque-Bera-test uit te voeren, een goodness-of-fit-test die bepaalt of de steekproefgegevens al dan niet scheefheid en kurtosis vertonen die consistent zijn met een normale verdeling.
Deze test maakt gebruik van de volgende aannames:
H 0 : Gegevens zijn normaal verdeeld.
H A : De gegevens zijn niet normaal verdeeld.
De JB- teststatistiek wordt gedefinieerd als:
JB =(n/6) * (S 2 + (C 2 /4))
Goud:
- n: het aantal waarnemingen in de steekproef
- S: de asymmetrie van het monster
- C: het flatterende exemplaar
Onder de nulhypothese van normaliteit is JB ~ X 2 (2).
Als de p-waarde die overeenkomt met de teststatistiek onder een bepaald significantieniveau ligt (bijvoorbeeld α = 0,05), dan kunnen we de nulhypothese verwerpen en concluderen dat de gegevens niet normaal verdeeld zijn.
Deze zelfstudie biedt een stapsgewijs voorbeeld van hoe u een Jarque-Bera-test uitvoert voor een bepaalde gegevensset in Excel.
Stap 1: Creëer de gegevens
Laten we eerst een nep-dataset maken met 15 waarden:
Stap 2: Bereken de teststatistiek
Bereken vervolgens de JB-teststatistiek. Kolom E toont de gebruikte formules:
De teststatistiek blijkt 1,0175 te zijn.
Stap 3: Bereken de P-waarde
Onder de nulhypothese van normaliteit volgt de JB-teststatistiek een Chi-kwadraatverdeling met 2 vrijheidsgraden.
Om de p-waarde voor de test te vinden, gebruiken we dus de volgende functie in Excel: =CHISQ.DIST.RT(JB-teststatistiek, 2)
De p-waarde van de test is 0,601244 . Omdat deze p-waarde niet kleiner is dan 0,05, slagen we er niet in de nulhypothese te verwerpen. We hebben niet genoeg bewijs om te zeggen dat de dataset niet normaal verdeeld is.
Met andere woorden, er kan worden aangenomen dat de gegevens normaal verdeeld zijn.
Aanvullende bronnen
Hoe u een QQ-plot maakt in Excel
Hoe u een Chi Square Fit-test uitvoert in Excel