Proc stdize gebruiken in sas (met voorbeeld)


Het standaardiseren van een variabele betekent dat elk van de waarden van de variabele zodanig wordt geschaald dat de gemiddelde waarde 0 is en de standaardafwijking 1.

U kunt de volgende formule gebruiken om een variabele te standaardiseren

(x ikx ) / s

Goud:

  • x i : de i- de waarde van de dataset
  • x : De steekproefgemiddelden
  • s : de standaarddeviatie van het monster

De eenvoudigste manier om een variabele in SAS te standaardiseren is door de instructie PROC STDIZE te gebruiken.

Het volgende voorbeeld laat zien hoe u deze verklaring in de praktijk kunt gebruiken.

Voorbeeld: PROC STDIZE gebruiken in SAS

Stel dat we de volgende dataset in SAS hebben die informatie bevat over verschillende basketbalspelers:

 /*create first dataset*/ 
data my_data;
    input player $ points assists rebounds;
    datalines ;
A 18 3 15
B 20 3 14
C 19 4 14
D 14 5 10
E 14 4 8
F 15 7 14
G 20 8 13
H 28 7 9
I 30 6 5
J 0 31 9 4
;
run ;

/*view dataset*/
proc print data =my_data;

We kunnen de PROC STDIZE- instructie gebruiken om een nieuwe dataset te maken die elk van de numerieke variabelen in de dataset standaardiseert:

 /*standardize all numeric variables in dataset*/
proc stdize data =my_data out =std_data;
run ;

/*view new dataset*/
proc print data =std_data; 

Elk van de numerieke variabelen (punten, assists, rebounds) werd gestandaardiseerd met een gemiddelde van 0 en een standaarddeviatie van 1.

Merk op dat we de VAR- instructie ook kunnen gebruiken om te specificeren welke variabelen moeten worden genormaliseerd.

We kunnen bijvoorbeeld de volgende PROC STDIZE- instructie gebruiken met de VAR -instructie om alleen de puntenvariabele te normaliseren:

 /*standardize points variable in dataset*/
proc stdize data =my_data out =std_data;
    var points;
run ;

/*view new dataset*/
proc print data =std_data; 

De waarden in de puntenkolom werden gestandaardiseerd terwijl alle andere kolommen intact bleven.

We kunnen de PROC MEANS- instructie gebruiken om te verifiëren dat de puntenvariabele nu een gemiddelde waarde van 0 en een standaardafwijking van 1 heeft:

 /*view mean and standard deviation of each variable*/
proc means data =std_data; 

We zien dat de puntenvariabele een gemiddelde waarde van 0 en een standaarddeviatie van 1 heeft.

Aanvullende bronnen

In de volgende zelfstudies wordt uitgelegd hoe u andere veelvoorkomende taken in SAS kunt uitvoeren:

Hoe rijen met ontbrekende waarden in SAS te verwijderen
Standaarddeviatie berekenen in SAS (3 voorbeelden)
Hoe Z-scores in SAS te berekenen

Einen Kommentar hinzufügen

Deine E-Mail-Adresse wird nicht veröffentlicht. Erforderliche Felder sind mit * markiert