Cara subset data di sas (3 contoh)


Berikut adalah tiga cara paling umum untuk membuat subset kumpulan data di SAS:

Metode 1: Pilih kolom mana yang akan dipertahankan

 data new_data;
    set original_data;
    keep var1 var3;
run ;

Metode 2: Pilih kolom mana yang akan dihapus

 data new_data;
    set original_data;
    dropvar4 ;
run ;

Metode 3: Pilih baris mana yang akan dipertahankan berdasarkan kondisi

 data new_data;
    set original_data;
    if var1 < 25 then delete;
run ;

Contoh berikut menunjukkan cara menggunakan setiap metode dengan himpunan data berikut di SAS:

 /*create dataset*/
data original_data;
    input team $pointsrebounds;
    datalines ;
Warriors 25 8
Wizards 18 12
Rockets 22 6
Celtics 24 11
Thunder 27 14
Spurs 33 19
Nets 31 20
;
run ;

/*view dataset*/
proc print data = original_data; 

Contoh 1: Pilih kolom mana yang akan dipertahankan

Kode berikut menunjukkan cara membuat subset kumpulan data menggunakan pernyataan KEEP untuk mempertahankan kolom tertentu saja:

 /*create new dataset*/
data new_data;
    set original_data;
    keep team points;
run ;

/*view new dataset*/
proc print data = new_data;

Contoh 2: Pilih kolom yang akan dihapus

Kode berikut menunjukkan cara mengelompokkan kumpulan data menggunakan pernyataan DROP untuk menghapus kolom tertentu:

 /*create new dataset*/
data new_data;
    set original_data;
    drop points;
run ;

/*view new dataset*/
proc print data = new_data;

Contoh 3: Pilih baris mana yang akan dipertahankan berdasarkan kondisi

Kode berikut menunjukkan cara membuat subset kumpulan data menggunakan pernyataan DELETE untuk menghapus baris tertentu dari kumpulan data yang nilainya di kolom titik kurang dari 25:

 /*create new dataset*/
data new_data;
    set original_data;
    if points < 25 then delete;
run ;

/*view new dataset*/
proc print data = new_data;

Anda juga dapat menggunakan ATAU| ” untuk menghilangkan garis yang poinnya kurang dari 25 atau pantulan kurang dari 10:

 /*create new dataset*/
data new_data;
    set original_data;
    if points < 25 | rebounds < 10 then delete;
run ;

/*view new dataset*/
proc print data = new_data; 

Anda juga dapat menggunakan operator AND& ” untuk menghilangkan garis yang titiknya kurang dari 25 dan pantulan kurang dari 10:

 /*create new dataset*/
data new_data;
    set original_data;
    if points < 25 & rebounds < 10 then delete;
run ;

/*view new dataset*/
proc print data = new_data; 

Sumber daya tambahan

Tutorial berikut menjelaskan cara melakukan tugas umum lainnya di SAS:

Cara mengganti nama variabel di SAS
Cara membuat variabel baru di SAS
Bagaimana cara mengganti karakter dalam string di SAS

Tambahkan komentar

Alamat email Anda tidak akan dipublikasikan. Ruas yang wajib ditandai *