Cara menormalkan data di sas


Untuk “menormalkan” sekumpulan nilai data berarti menskalakan nilai sedemikian rupa sehingga rata-rata semua nilai adalah 0 dan simpangan bakunya adalah 1.

Tutorial ini menjelaskan cara normalisasi data di SAS.

Contoh: Cara normalisasi data di SAS

Misalkan kita memiliki kumpulan data berikut:

Selesaikan langkah-langkah berikut untuk menormalkan kumpulan nilai data ini di SAS.

Langkah 1: Buat kumpulan data

Pertama, mari gunakan kode berikut untuk membuat dataset di SAS:

 /*create dataset*/
data original_data;
    input values;
    datalines ;
12
14
15
15
16
17
18
20
24
25
26
29
32
34
37
;
run ;

/*view mean and standard deviation of dataset*/
proc means data =original_data Mean StdDev ndec= 3 ; 
   var values;
run ; 

Dari hasil tersebut terlihat bahwa mean dataset adalah 22.267 dan standar deviasinya adalah 7.968 .

Langkah 2: Normalisasikan Kumpulan Data

Selanjutnya, kita akan menggunakan proc stdize untuk menormalkan dataset:

 /*normalize the dataset*/
proc stdize data =original_data out =normalized_data;
   var values;
run ;

/*print normalized dataset*/
proc print data =normalized_data;
 
/*view mean and standard deviation of normalized dataset*/
proc means data =normalized_data Mean StdDev ndec= 2 ; 
   var values;
run ; 

Dari hasilnya terlihat bahwa mean dari dataset yang dinormalisasi adalah 0 dan standar deviasinya adalah 1 .

Langkah 3: Interpretasikan data yang dinormalisasi

SAS menggunakan rumus berikut untuk menormalkan nilai data:

Nilai yang dinormalisasi = (x – x ) / s

Emas:

  • x = nilai data
  • x = rata-rata kumpulan data
  • s = deviasi standar kumpulan data

Setiap nilai yang dinormalisasi memberi tahu kita jumlah deviasi standar antara nilai data asli dan mean.

Misalnya, pertimbangkan titik data “12” dalam kumpulan data asli kami. Rata-rata sampel asli adalah 22,267 dan standar deviasi sampel asli adalah 7,968.

Nilai normalisasi untuk “12” ternyata -1,288, dihitung sebagai berikut:

Nilai normalisasi = (x – x ) / s = (12 – 22.267) / 7.968 = -1.288

Hal ini menunjukkan bahwa nilai “12” adalah 1,288 standar deviasi lebih rendah dari rata-rata kumpulan data asli.

Setiap nilai yang dinormalisasi dalam kumpulan data dapat membantu kita memahami seberapa dekat atau jauh nilai data tertentu dari mean.

Nilai ternormalisasi yang kecil menunjukkan bahwa suatu nilai mendekati mean, sedangkan nilai ternormalisasi yang besar menunjukkan bahwa suatu nilai jauh dari mean.

Sumber daya tambahan

Tutorial berikut menjelaskan cara melakukan tugas umum lainnya di SAS:

Cara menggunakan ringkasan prosedur di SAS
Cara menghitung korelasi di SAS
Cara membuat tabel frekuensi di SAS

Tambahkan komentar

Alamat email Anda tidak akan dipublikasikan. Ruas yang wajib ditandai *