Sas'ta veriler nasıl normalleştirilir?


Bir dizi veri değerini “normalleştirmek”, değerleri tüm değerlerin ortalaması 0 ve standart sapma 1 olacak şekilde ölçeklendirmek anlamına gelir.

Bu eğitimde SAS’taki verilerin nasıl normalleştirileceği açıklanmaktadır.

Örnek: SAS’taki veriler nasıl normalleştirilir?

Aşağıdaki veri setine sahip olduğumuzu varsayalım:

SAS’taki bu veri değerleri kümesini normalleştirmek için aşağıdaki adımları tamamlayın.

1. Adım: Veri kümesini oluşturun

Öncelikle SAS’ta veri kümesini oluşturmak için aşağıdaki kodu kullanalım:

 /*create dataset*/
data original_data;
    input values;
    datalines ;
12
14
15
15
16
17
18
20
24
25
26
29
32
34
37
;
run ;

/*view mean and standard deviation of dataset*/
proc means data =original_data Mean StdDev ndec= 3 ; 
   var values;
run ; 

Sonuçtan veri setinin ortalamasının 22.267 , standart sapmasının ise 7.968 olduğunu görebiliyoruz.

2. Adım: Veri Kümesini Normalleştirin

Daha sonra veri kümesini normalleştirmek için proc stdize’ı kullanacağız:

 /*normalize the dataset*/
proc stdize data =original_data out =normalized_data;
   var values;
run ;

/*print normalized dataset*/
proc print data =normalized_data;
 
/*view mean and standard deviation of normalized dataset*/
proc means data =normalized_data Mean StdDev ndec= 2 ; 
   var values;
run ; 

Sonuçtan normalleştirilmiş veri kümesinin ortalamasının 0 ve standart sapmanın 1 olduğunu görebiliriz.

3. Adım: Normalleştirilmiş verileri yorumlayın

SAS, veri değerlerini normalleştirmek için aşağıdaki formülü kullandı:

Normalleştirilmiş değer = (x – x ) / s

Altın:

  • x = veri değeri
  • x = veri kümesinin ortalaması
  • s = veri kümesinin standart sapması

Her normalleştirilmiş değer bize orijinal veri değeri ile ortalama arasındaki standart sapmaların sayısını söyler.

Örneğin, orijinal veri kümemizdeki “12” veri noktasını düşünün. Orijinal numune ortalaması 22.267 ve orijinal numune standart sapması 7.968 idi.

“12” için normalleştirilmiş değer -1,288 olarak ortaya çıktı ve şu şekilde hesaplandı:

Normalleştirilmiş değer = (x – x ) / s = (12 – 22,267) / 7,968 = -1,288

Bu bize “12” değerinin orijinal veri kümesinin ortalamasından 1,288 standart sapma daha düşük olduğunu söylüyor.

Veri kümesindeki normalleştirilmiş değerlerin her biri, belirli bir veri değerinin ortalamaya ne kadar yakın veya uzak olduğunu anlamamıza yardımcı olabilir.

Küçük bir normalleştirilmiş değer, bir değerin ortalamaya yakın olduğunu gösterirken, büyük bir normalleştirilmiş değer, bir değerin ortalamadan uzak olduğunu gösterir.

Ek kaynaklar

Aşağıdaki eğitimlerde SAS’ta diğer ortak görevlerin nasıl gerçekleştirileceği açıklanmaktadır:

SAS’ta prosedür özeti nasıl kullanılır?
SAS’ta korelasyon nasıl hesaplanır?
SAS’ta frekans tabloları nasıl oluşturulur?

Yorum ekle

E-posta hesabınız yayımlanmayacak. Gerekli alanlar * ile işaretlenmişlerdir