Cara melakukan transformasi log di sas

Banyak uji statistik yang mengasumsikan bahwa nilai suatu variabel tertentu terdistribusi normal .

Namun seringkali nilainya tidak terdistribusi normal. Salah satu cara untuk mengatasi masalah ini adalah dengan mentransformasikan variabel dengan mengambil log dari setiap nilai.

Dengan melakukan transformasi ini, suatu variabel secara umum mendekati distribusi normal.

Contoh berikut menunjukkan cara melakukan transformasi log pada variabel di SAS.

Contoh: Transformasi Log di SAS

Anggaplah kita memiliki kumpulan data berikut di SAS:

 /*create dataset*/
data my_data;
    input x;
    datalines ;
1
1
1
2
2
2
2
2
2
3
3
3
6
7
8
;
run ;

/*view dataset*/
proc print data =my_data;

Kita dapat menggunakan PROC UNIVARIATE untuk melakukan uji normalitas pada variabel x untuk menentukan apakah variabel tersebut terdistribusi normal dan juga membuat histogram untuk memvisualisasikan distribusi nilai:

 /*create histogram and perform normality tests*/
proc univariate data =my_data normal ; 
histogram x;
run ; 

Pada tabel terakhir yang berjudul Uji Normalitas , kita dapat melihat bahwa nilai p dari uji Shapiro-Wilk kurang dari 0,05, yang memberikan bukti kuat bahwa variabel x tidak terdistribusi normal.

Histogram juga menunjukkan bahwa sebaran nilai tampak tidak terdistribusi normal:

Kita dapat mencoba transformasi log pada kumpulan data asli untuk melihat apakah kita dapat menghasilkan kumpulan data yang lebih terdistribusi secara normal.

Kita dapat menggunakan kode berikut untuk membuat kumpulan data baru di SAS tempat kita mengambil log dari setiap nilai x asli:

 /*use log transformation to create new dataset*/
data log_data;
    set my_data;
    x = log (x);
run ;

/*view log transformed data*/
proc print data =log_data; 

Kita kemudian dapat menggunakan PROC UNIVARIATE lagi untuk melakukan uji normalitas pada variabel yang diubah dan juga menghasilkan histogram:

 /*create histogram and perform normality tests*/
proc univariate data =log_data normal ; 
histogram x;
run ; 

Pada tabel terakhir yang berjudul Uji Normalitas, kita dapat melihat bahwa nilai p untuk uji Shapiro-Wilk kini lebih besar dari 0,05.

Histogram juga menunjukkan bahwa distribusi nilai sedikit lebih normal dibandingkan sebelum transformasi:

Berdasarkan hasil uji Shapiro-Wilk dan histogram yang disajikan di atas, kita dapat menyimpulkan bahwa transformasi logaritmik menghasilkan variabel yang jauh lebih terdistribusi normal dibandingkan variabel aslinya.

Sumber daya tambahan

Tutorial berikut menjelaskan cara melakukan tugas umum lainnya di SAS:

Cara mengidentifikasi outlier di SAS
Cara menghitung jarak masak di SAS
Cara Membuat Histogram di SAS

Tambahkan komentar

Alamat email Anda tidak akan dipublikasikan. Ruas yang wajib ditandai *