Jak korzystać z proc stdize w sas-ie (z przykładem)
Standaryzacja zmiennej oznacza skalowanie każdej wartości zmiennej w taki sposób, że średnia wartość wynosi 0, a odchylenie standardowe wynosi 1.
Aby ujednolicić zmienną, możesz użyć poniższej formuły
(x i – x ) / s
Złoto:
- x i : i-ta wartość zbioru danych
- x : Przykładowe środki
- s : odchylenie standardowe próbki
Najłatwiejszym sposobem standaryzacji zmiennej w SAS-ie jest użycie instrukcji PROC STDIZE .
Poniższy przykład pokazuje, jak używać tego stwierdzenia w praktyce.
Przykład: Jak używać PROC STDIZE w SAS-ie
Załóżmy, że mamy następujący zbiór danych w SAS-ie, który zawiera informacje o różnych koszykarzach:
/*create first dataset*/
data my_data;
input player $ points assists rebounds;
datalines ;
A 18 3 15
B 20 3 14
C 19 4 14
D 14 5 10
E 14 4 8
F 15 7 14
G 20 8 13
H 28 7 9
I 30 6 5
J 0 31 9 4
;
run ;
/*view dataset*/
proc print data =my_data;
Możemy użyć instrukcji PROC STDIZE , aby utworzyć nowy zbiór danych, który standaryzuje każdą ze zmiennych numerycznych w zbiorze danych:
/*standardize all numeric variables in dataset*/
proc stdize data =my_data out =std_data;
run ;
/*view new dataset*/
proc print data =std_data;
Każdą ze zmiennych liczbowych (punkty, asysty, zbiórki) standaryzowano tak, aby miała średnią 0 i odchylenie standardowe 1.
Należy pamiętać, że możemy również użyć instrukcji VAR , aby określić, które zmienne mają zostać znormalizowane.
Na przykład możemy użyć następującej instrukcji PROC STDIZE z instrukcją VAR , aby znormalizować tylko zmienną punktów:
/*standardize points variable in dataset*/
proc stdize data =my_data out =std_data;
var points;
run ;
/*view new dataset*/
proc print data =std_data;
Wartości w kolumnie punktów zostały ujednolicone, podczas gdy wszystkie pozostałe kolumny pozostały nienaruszone.
Możemy użyć instrukcji PROC MEANS , aby sprawdzić, czy zmienna punktów ma teraz średnią wartość 0 i odchylenie standardowe 1:
/*view mean and standard deviation of each variable*/ proc means data =std_data;
Widzimy, że zmienna punktów ma średnią wartość 0 i odchylenie standardowe 1.
Dodatkowe zasoby
Poniższe samouczki wyjaśniają, jak wykonywać inne typowe zadania w SAS-ie:
Jak usunąć wiersze z brakującymi wartościami w SAS-ie
Jak obliczyć odchylenie standardowe w SAS (3 przykłady)
Jak obliczyć wyniki Z w SAS