Gegevens transformeren in excel (logboek, vierkantswortel, kubuswortel)
Veel statistische tests gaan ervan uit dat datasets normaal verdeeld zijn.
Deze veronderstelling wordt in de praktijk echter vaak geschonden. Eén manier om dit probleem op te lossen is door de waarden in de dataset te transformeren met behulp van een van de volgende drie transformaties:
1. Log Transform: Transformeer y-waarden naar log(y) .
2. Vierkantsworteltransformatie: transformeer y-waarden naar √y .
3. Derdemachtsworteltransformatie: transformeer y-waarden naar y 1/3 .
Door deze transformaties uit te voeren, benaderen de gegevens over het algemeen de normale verdeling. De volgende voorbeelden laten zien hoe u deze transformaties in Excel kunt uitvoeren.
Logboektransformatie in Excel
Om een logtransformatie toe te passen op een gegevensset in Excel, kunnen we de functie =LOG10() gebruiken.
De volgende schermafbeelding laat zien hoe u een logtransformatie toepast op een gegevensset in Excel:
Om te bepalen of deze transformatie de dataset normaler verdeeld heeft gemaakt, kunnen we een Jarque-Bera-normaliteitstest uitvoeren in Excel .
De teststatistiek voor deze test wordt gedefinieerd als:
JB =(n/6) * (S 2 + (C 2 /4))
Goud:
- n: het aantal waarnemingen in de steekproef
- S: de asymmetrie van het monster
- C: het flatterende exemplaar
Onder de nulhypothese van normaliteit is JB ~ X 2 (2).
Als de p-waarde die overeenkomt met de teststatistiek onder een bepaald significantieniveau ligt (bijvoorbeeld α = 0,05), dan kunnen we de nulhypothese verwerpen en concluderen dat de gegevens niet normaal verdeeld zijn.
De volgende schermafbeelding laat zien hoe u een Jarque-Bera-test uitvoert voor onbewerkte gegevens en getransformeerde gegevens:
Merk op dat de p-waarde van de onbewerkte gegevens kleiner is dan 0,05, wat aangeeft dat deze niet normaal verdeeld is .
De p-waarde van de getransformeerde gegevens is echter niet kleiner dan 0,05, dus we kunnen aannemen dat deze normaal verdeeld is . Dit vertelt ons dat de logtransformatie werkte.
Vierkantsworteltransformatie in Excel
Om een vierkantsworteltransformatie toe te passen op een set gegevens in Excel, kunnen we de functie =SQRT() gebruiken.
De volgende schermafbeelding laat zien hoe u een vierkantsworteltransformatie toepast op een gegevensset in Excel:
Merk op dat de p-waarde van de Jarque-Bera-normaliteitstest voor de getransformeerde gegevens niet minder dan 0,05 bedraagt, wat aangeeft dat de vierkantsworteltransformatie effectief was.
Kubusworteltransformatie in Excel
Om een kubusworteltransformatie toe te passen op een reeks gegevens in Excel, kunnen we de functie =DATA^(1/3) gebruiken.
De volgende schermafbeelding laat zien hoe u een kubusworteltransformatie toepast op een gegevensset in Excel:
De p-waarde van de Jarque-Bera-normaliteitstest voor de getransformeerde gegevens is niet minder dan 0,05, wat aangeeft dat de derdemachtsworteltransformatie effectief was.
De drie datatransformaties zorgden ervoor dat de ruwe data feitelijk normaler verdeeld waren.
Van de drie transformaties leverde de logaritmische transformatie de hoogste p-waarde op in de Jarque-Bera-normaliteitstest, wat ons vertelt dat de gegevens hierdoor waarschijnlijk de „meest“ normaal verdeelde gegevens onder de drie methoden-transformaties zijn geworden.
Aanvullende bronnen
Hoe u een Box-Cox-transformatie uitvoert in Excel
Wat is de normaliteitsaanname in de statistiek?