Hoe u gegevens kunt winnen in excel
Winsoriseren van gegevens houdt in dat extreme uitschieters gelijk worden gesteld aan een bepaald percentiel van de gegevens.
Een winsorisatie van 90% stelt bijvoorbeeld alle waarnemingen boven het 95e percentiel gelijk aan de waarde op het 95e percentiel en alle waarnemingen onder het 5e percentiel gelijk aan de waarde op het 5e percentiel.
Deze zelfstudie biedt een stapsgewijs voorbeeld van hoe u een gegevensset in Excel kunt winnen.
Stap 1: Creëer de gegevens
Eerst zullen we de volgende dataset maken:
Stap 2: Bereken de bovenste en onderste percentielen
Voor dit voorbeeld voeren we een winsorisatie van 90% uit. Dit betekent dat we alle waarden boven het 95e percentiel gelijk stellen aan het 95e percentiel en alle waarden onder het 5e percentiel gelijk stellen aan het 5e percentiel.
De volgende formules laten zien hoe u het 5e en 95e percentiel kunt vinden:
Het 5e percentiel blijkt 12,35 te zijn en het 95e percentiel blijkt 92,05 te zijn.
Stap 3: Winsoriseer de gegevens
Ten slotte zullen we de volgende formule gebruiken om de gegevens te winnen:
Merk op dat we eenvoudigweg de formule van cel F2 kopiëren en plakken in de resterende cellen in kolom F.
In dit geval werd de waarde 3 12,35 en de waarde 98 werd 92,05 .
Merk op dat we in dit voorbeeld een winsorisatie van 90% hebben uitgevoerd, maar het is ook mogelijk om een winsorisatie van 80%, een winsorisatie van 95%, een winsorisatie van 99%, enz. uit te voeren. door simpelweg verschillende bovenste en onderste percentielen te berekenen.