Jak korzystać z proc stdize w sas-ie (z przykładem)


Standaryzacja zmiennej oznacza skalowanie każdej wartości zmiennej w taki sposób, że średnia wartość wynosi 0, a odchylenie standardowe wynosi 1.

Aby ujednolicić zmienną, możesz użyć poniższej formuły

(x ix ) / s

Złoto:

  • x i : i-ta wartość zbioru danych
  • x : Przykładowe środki
  • s : odchylenie standardowe próbki

Najłatwiejszym sposobem standaryzacji zmiennej w SAS-ie jest użycie instrukcji PROC STDIZE .

Poniższy przykład pokazuje, jak używać tego stwierdzenia w praktyce.

Przykład: Jak używać PROC STDIZE w SAS-ie

Załóżmy, że mamy następujący zbiór danych w SAS-ie, który zawiera informacje o różnych koszykarzach:

 /*create first dataset*/ 
data my_data;
    input player $ points assists rebounds;
    datalines ;
A 18 3 15
B 20 3 14
C 19 4 14
D 14 5 10
E 14 4 8
F 15 7 14
G 20 8 13
H 28 7 9
I 30 6 5
J 0 31 9 4
;
run ;

/*view dataset*/
proc print data =my_data;

Możemy użyć instrukcji PROC STDIZE , aby utworzyć nowy zbiór danych, który standaryzuje każdą ze zmiennych numerycznych w zbiorze danych:

 /*standardize all numeric variables in dataset*/
proc stdize data =my_data out =std_data;
run ;

/*view new dataset*/
proc print data =std_data; 

Każdą ze zmiennych liczbowych (punkty, asysty, zbiórki) standaryzowano tak, aby miała średnią 0 i odchylenie standardowe 1.

Należy pamiętać, że możemy również użyć instrukcji VAR , aby określić, które zmienne mają zostać znormalizowane.

Na przykład możemy użyć następującej instrukcji PROC STDIZE z instrukcją VAR , aby znormalizować tylko zmienną punktów:

 /*standardize points variable in dataset*/
proc stdize data =my_data out =std_data;
    var points;
run ;

/*view new dataset*/
proc print data =std_data; 

Wartości w kolumnie punktów zostały ujednolicone, podczas gdy wszystkie pozostałe kolumny pozostały nienaruszone.

Możemy użyć instrukcji PROC MEANS , aby sprawdzić, czy zmienna punktów ma teraz średnią wartość 0 i odchylenie standardowe 1:

 /*view mean and standard deviation of each variable*/
proc means data =std_data; 

Widzimy, że zmienna punktów ma średnią wartość 0 i odchylenie standardowe 1.

Dodatkowe zasoby

Poniższe samouczki wyjaśniają, jak wykonywać inne typowe zadania w SAS-ie:

Jak usunąć wiersze z brakującymi wartościami w SAS-ie
Jak obliczyć odchylenie standardowe w SAS (3 przykłady)
Jak obliczyć wyniki Z w SAS

Dodaj komentarz

Twój adres e-mail nie zostanie opublikowany. Wymagane pola są oznaczone *