Cara menggunakan proc compare di sas (dengan contoh)


Anda dapat menggunakan PROC COMPARE di SAS untuk mengidentifikasi persamaan dan perbedaan antara dua kumpulan data dengan cepat.

Prosedur ini menggunakan sintaks dasar berikut:

 proc compare
    base =data1
    compare =data2;
run ;

Contoh berikut menunjukkan bagaimana menggunakan prosedur ini dalam praktiknya.

Contoh: Menggunakan Proc Compare di SAS

Anggaplah kita memiliki dua kumpulan data berikut di SAS:

 /*create datasets*/
data data1;
    input team $pointsrebounds;
    datalines ;
At 25 10
B 18 4
C 18 7
D 24 12
E 27 11
;
run ;

data data2;
    input team $points;
    datalines ;
At 25
B 18
F 27
G21
H 20
;
run ;

/*view datasets*/
proc print data =data1;
proc print data =data2; 

Kita dapat menggunakan pernyataan PROC COMPARE berikut untuk menemukan persamaan dan perbedaan antara kedua kumpulan data:

 /*compare the two datasets*/
proc compare
    base =data1
    compare =data2;
run ;

Ini akan menghasilkan tiga tabel pada output:

Tabel 1: Ringkasan kedua tabel

Tabel pertama memberikan ringkasan singkat dari setiap dataset, termasuk:

1. Jumlah variabel (NVar) dan observasi (NObs) pada setiap kumpulan data.

  • Data1 memiliki 3 variabel dan 5 observasi
  • Data2 memiliki 2 variabel dan 5 observasi

2. Banyaknya variabel persekutuan antara dua kumpulan data.

  • Data1 dan Data2 memiliki 2 variabel yang sama (tim dan poin)

Tabel 2: Ringkasan jumlah perbedaan nilai

Tabel kedua merangkum jumlah selisih nilai antara kedua tabel.

Bagian paling menarik dari keluaran ini ada di akhir tabel di mana kita bisa melihat ringkasan perbedaan antar variabel:

  • Variabel tim mempunyai 3 observasi dengan nilai berbeda.
  • Variabel titik mempunyai 3 observasi dengan nilai berbeda. Selisih maksimumnya adalah 9.

Tabel 3: Perbedaan aktual antar observasi

Tabel ketiga menunjukkan perbedaan aktual antara observasi pada kedua dataset.

Tabel pertama menunjukkan perbedaan variabel tim antara kedua kumpulan data.

  • Misalnya pada data1 observasi ketiga bernilai C untuk tim sedangkan pada data2 observasi ketiga bernilai F.

Tabel kedua menunjukkan perbedaan variabel poin antara kedua dataset.

  • Misalnya pada data1 observasi ketiga bernilai 18 poin sedangkan pada data2 observasi ketiga bernilai 27 . Selisih kedua nilai tersebut adalah 9 .

Ketiga tabel ini memberi kita pemahaman lengkap tentang perbedaan antara kedua kumpulan data.

Perhatikan bahwa jika Anda hanya ingin membandingkan perbedaan antara dua kumpulan data untuk variabel tertentu, Anda dapat menggunakan sintaks berikut:

 /*compare the differences between the datasets only for 'points' variable*/
proc compare
    base =data1
    compare =data2;
var points;
run ;

Ini akan menghasilkan tiga tabel yang sama seperti sebelumnya, namun hanya output dari variabel poin yang akan ditampilkan.

Catatan : Anda dapat menemukan dokumentasi lengkap PROC COMPARE di sini .

Sumber daya tambahan

Tutorial berikut menjelaskan cara melakukan tugas umum lainnya di SAS:

Cara menggunakan ringkasan prosedur di SAS
Cara menggunakan Proc Tabulate di SAS
Cara menggunakan pemeriksaan Proc di SAS

Tambahkan komentar

Alamat email Anda tidak akan dipublikasikan. Ruas yang wajib ditandai *