Jak normalizować dane w sas-ie
„Normalizacja” zbioru wartości danych oznacza skalowanie wartości w taki sposób, aby średnia wszystkich wartości wynosiła 0, a odchylenie standardowe wynosiło 1.
W tym samouczku wyjaśniono, jak normalizować dane w SAS-ie.
Przykład: Jak normalizować dane w SAS-ie
Załóżmy, że mamy następujący zbiór danych:
Wykonaj poniższe kroki, aby znormalizować ten zestaw wartości danych w SAS-ie.
Krok 1: Utwórz zbiór danych
Najpierw użyjmy poniższego kodu, aby utworzyć zbiór danych w SAS-ie:
/*create dataset*/ data original_data; input values; datalines ; 12 14 15 15 16 17 18 20 24 25 26 29 32 34 37 ; run ; /*view mean and standard deviation of dataset*/ proc means data =original_data Mean StdDev ndec= 3 ; var values; run ;
Z wyniku widzimy, że średnia zbioru danych wynosi 22,267 , a odchylenie standardowe wynosi 7,968 .
Krok 2: Normalizuj zbiór danych
Następnie użyjemy proc stdize do normalizacji zbioru danych:
/*normalize the dataset*/
proc stdize data =original_data out =normalized_data;
var values;
run ;
/*print normalized dataset*/
proc print data =normalized_data;
/*view mean and standard deviation of normalized dataset*/
proc means data =normalized_data Mean StdDev ndec= 2 ;
var values;
run ;
Z wyniku widzimy, że średnia znormalizowanego zbioru danych wynosi 0 , a odchylenie standardowe wynosi 1 .
Krok 3: Interpretacja znormalizowanych danych
SAS zastosował następującą formułę do normalizacji wartości danych:
Wartość znormalizowana = (x – x ) / s
Złoto:
- x = wartość danych
- x = średnia zbioru danych
- s = odchylenie standardowe zbioru danych
Każda znormalizowana wartość informuje nas o liczbie odchyleń standardowych między pierwotną wartością danych a średnią.
Rozważmy na przykład punkt danych „12” w naszym oryginalnym zbiorze danych. Pierwotna średnia próbki wynosiła 22,267, a odchylenie standardowe pierwotnej próbki wynosiło 7,968.
Znormalizowana wartość dla „12” okazała się wynosić -1,288, obliczona w następujący sposób:
Wartość znormalizowana = (x – x ) / s = (12 – 22,267) / 7,968 = -1,288
To mówi nam, że wartość „12” jest o 1,288 odchylenia standardowego niższa od średniej z pierwotnego zbioru danych.
Każda ze znormalizowanych wartości w zbiorze danych może pomóc nam zrozumieć, jak blisko lub daleko od średniej znajduje się konkretna wartość danych.
Mała znormalizowana wartość wskazuje, że wartość jest bliska średniej, natomiast duża znormalizowana wartość wskazuje, że wartość jest daleka od średniej.
Dodatkowe zasoby
Poniższe samouczki wyjaśniają, jak wykonywać inne typowe zadania w SAS-ie:
Jak korzystać ze podsumowania procedur w SAS-ie
Jak obliczyć korelację w SAS-ie
Jak tworzyć tabele częstości w SAS-ie