Sas'ta günlük dönüşümü nasıl gerçekleştirilir?

Birçok istatistiksel test, belirli bir değişkenin değerlerinin normal dağıldığını varsayar.

Ancak değerler çoğu zaman normal dağılıma sahip değildir . Bu sorunu çözmenin bir yolu, her değerin günlüğünü alarak değişkeni dönüştürmektir.

Bu dönüşümü gerçekleştirerek bir değişken genel olarak normal dağılıma yaklaşır.

Aşağıdaki örnek, SAS’taki bir değişken üzerinde günlük dönüşümünün nasıl gerçekleştirileceğini gösterir.

Örnek: SAS’ta Günlük Dönüşümü

SAS’ta aşağıdaki veri setine sahip olduğumuzu varsayalım:

 /*create dataset*/
data my_data;
    input x;
    datalines ;
1
1
1
2
2
2
2
2
2
3
3
3
6
7
8
;
run ;

/*view dataset*/
proc print data =my_data;

PROC UNIVARIATE’i, x değişkeni üzerinde normallik testleri gerçekleştirmek ve bunun normal şekilde dağılıp dağılmadığını belirlemek için kullanabiliriz ve ayrıca değerlerin dağılımını görselleştirmek için bir histogram oluşturabiliriz:

 /*create histogram and perform normality tests*/
proc univariate data =my_data normal ; 
histogram x;
run ; 

Normallik Testleri başlıklı son tabloda Shapiro-Wilk testinin p değerinin 0,05’ten küçük olduğunu görebiliyoruz, bu da x değişkeninin normal dağılmadığına dair güçlü bir kanıt sağlıyor.

Histogram ayrıca değerlerin dağılımının normal şekilde dağılmadığını da gösteriyor:

Daha normal dağıtılmış bir veri kümesi üretip üretemeyeceğimizi görmek için orijinal veri kümesi üzerinde bir log dönüşümü deneyebiliriz.

SAS’ta orijinal x değerlerinin her birinin günlüğünü aldığımız yeni bir veri kümesi oluşturmak için aşağıdaki kodu kullanabiliriz:

 /*use log transformation to create new dataset*/
data log_data;
    set my_data;
    x = log (x);
run ;

/*view log transformed data*/
proc print data =log_data; 

Daha sonra dönüştürülmüş değişken üzerinde normallik testleri gerçekleştirmek ve ayrıca bir histogram oluşturmak için PROC UNIVARIATE’i tekrar kullanabiliriz:

 /*create histogram and perform normality tests*/
proc univariate data =log_data normal ; 
histogram x;
run ; 

Normallik Testleri başlıklı son tabloda Shapiro-Wilk testinin p değerinin artık 0,05’ten büyük olduğunu görüyoruz.

Histogram ayrıca değerlerin dağılımının dönüşüm öncesine göre biraz daha normal olduğunu gösteriyor:

Shapiro-Wilk testinin ve yukarıda sunulan histogramın sonuçlarına dayanarak, logaritmik dönüşümün orijinal değişkenden çok daha normal dağılıma sahip bir değişken oluşturduğu sonucuna varabiliriz.

Ek kaynaklar

Aşağıdaki eğitimlerde SAS’ta diğer ortak görevlerin nasıl gerçekleştirileceği açıklanmaktadır:

SAS’ta aykırı değerler nasıl belirlenir
SAS’ta pişirme mesafesi nasıl hesaplanır
SAS’ta Histogramlar Nasıl Oluşturulur

Yorum ekle

E-posta hesabınız yayımlanmayacak. Gerekli alanlar * ile işaretlenmişlerdir