Proc stdize gebruiken in sas (met voorbeeld)
Het standaardiseren van een variabele betekent dat elk van de waarden van de variabele zodanig wordt geschaald dat de gemiddelde waarde 0 is en de standaardafwijking 1.
U kunt de volgende formule gebruiken om een variabele te standaardiseren
(x ik – x ) / s
Goud:
- x i : de i- de waarde van de dataset
- x : De steekproefgemiddelden
- s : de standaarddeviatie van het monster
De eenvoudigste manier om een variabele in SAS te standaardiseren is door de instructie PROC STDIZE te gebruiken.
Het volgende voorbeeld laat zien hoe u deze verklaring in de praktijk kunt gebruiken.
Voorbeeld: PROC STDIZE gebruiken in SAS
Stel dat we de volgende dataset in SAS hebben die informatie bevat over verschillende basketbalspelers:
/*create first dataset*/
data my_data;
input player $ points assists rebounds;
datalines ;
A 18 3 15
B 20 3 14
C 19 4 14
D 14 5 10
E 14 4 8
F 15 7 14
G 20 8 13
H 28 7 9
I 30 6 5
J 0 31 9 4
;
run ;
/*view dataset*/
proc print data =my_data;
We kunnen de PROC STDIZE- instructie gebruiken om een nieuwe dataset te maken die elk van de numerieke variabelen in de dataset standaardiseert:
/*standardize all numeric variables in dataset*/
proc stdize data =my_data out =std_data;
run ;
/*view new dataset*/
proc print data =std_data;
Elk van de numerieke variabelen (punten, assists, rebounds) werd gestandaardiseerd met een gemiddelde van 0 en een standaarddeviatie van 1.
Merk op dat we de VAR- instructie ook kunnen gebruiken om te specificeren welke variabelen moeten worden genormaliseerd.
We kunnen bijvoorbeeld de volgende PROC STDIZE- instructie gebruiken met de VAR -instructie om alleen de puntenvariabele te normaliseren:
/*standardize points variable in dataset*/
proc stdize data =my_data out =std_data;
var points;
run ;
/*view new dataset*/
proc print data =std_data;
De waarden in de puntenkolom werden gestandaardiseerd terwijl alle andere kolommen intact bleven.
We kunnen de PROC MEANS- instructie gebruiken om te verifiëren dat de puntenvariabele nu een gemiddelde waarde van 0 en een standaardafwijking van 1 heeft:
/*view mean and standard deviation of each variable*/ proc means data =std_data;
We zien dat de puntenvariabele een gemiddelde waarde van 0 en een standaarddeviatie van 1 heeft.
Aanvullende bronnen
In de volgende zelfstudies wordt uitgelegd hoe u andere veelvoorkomende taken in SAS kunt uitvoeren:
Hoe rijen met ontbrekende waarden in SAS te verwijderen
Standaarddeviatie berekenen in SAS (3 voorbeelden)
Hoe Z-scores in SAS te berekenen