Cara menghapus duplikat di sas (dengan contoh)
Anda dapat menggunakan proc sort di SAS untuk menghapus baris duplikat dengan cepat dari kumpulan data.
Prosedur ini menggunakan sintaks dasar berikut:
proc sort data =original_data out =no_dups_data nodupkey ;
by _all_;
run;
Perhatikan bahwa argumen by menentukan kolom mana yang akan dipindai saat menghapus duplikat.
Contoh berikut menunjukkan cara menghapus duplikat dari kumpulan data berikut di SAS:
/*create dataset*/
data original_data;
input team $position $points;
datalines ;
A Guard 12
A Guard 20
A Guard 20
A Guard 24
A Forward 15
A Forward 15
A Forward 19
A Forward 28
B Guard 10
B Guard 12
B Guard 12
B Guard 26
B Forward 10
B Forward 10
B Forward 10
B Forward 19
;
run ;
/*view dataset*/
proc print data = original_data;
Contoh 1: Hapus duplikat dari semua kolom
Kita dapat menggunakan kode berikut untuk menghapus baris yang memiliki nilai duplikat di semua kolom pada dataset:
/*create dataset with no duplicate rows*/
proc sort data =original_data out =no_dups_data nodupkey ;
by _all_;
run ;
/*view dataset with no duplicate rows*/
proc print data =no_dups_data;
Perhatikan bahwa total lima baris duplikat telah dihapus dari kumpulan data asli.
Contoh 2: Hapus duplikat dari kolom tertentu
Kita dapat menggunakan argumen by untuk menentukan kolom mana yang akan diperiksa saat menghapus duplikat.
Misalnya, kode berikut menghapus baris dengan nilai duplikat di kolom tim dan posisi :
/*create dataset with no duplicate rows in team and position columns*/
proc sort data =original_data out =no_dups_data nodupkey ;
by team position;
run ;
/*view dataset with no duplicate rows in team and position columns*/
proc print data =no_dups_data;
Hanya empat baris yang tersisa di kumpulan data setelah menghapus baris dengan nilai duplikat di kolom tim dan posisi .
Sumber daya tambahan
Tutorial berikut menjelaskan cara melakukan operasi umum lainnya di SAS:
Cara menormalkan data di SAS
Cara mengidentifikasi outlier di SAS
Cara menggunakan ringkasan prosedur di SAS
Cara membuat tabel frekuensi di SAS