Sas'taki kopyalar nasıl kaldırılır (örneklerle)


Bir veri kümesinden yinelenen satırları hızla kaldırmak için SAS’ta proc sort’u kullanabilirsiniz.

Bu prosedür aşağıdaki temel sözdizimini kullanır:

 proc sort data =original_data out =no_dups_data nodupkey ;
by _all_;
run;

By bağımsız değişkeninin, kopyaları kaldırırken hangi sütunların taranacağını belirttiğini unutmayın.

Aşağıdaki örnekler, SAS’ta aşağıdaki veri kümesindeki kopyaların nasıl kaldırılacağını gösterir:

 /*create dataset*/
data original_data;
    input team $position $points;
    datalines ;
A Guard 12
A Guard 20
A Guard 20
A Guard 24
A Forward 15
A Forward 15
A Forward 19
A Forward 28
B Guard 10
B Guard 12
B Guard 12
B Guard 26
B Forward 10
B Forward 10
B Forward 10
B Forward 19
;
run ;

/*view dataset*/
proc print data = original_data; 

Örnek 1: Tüm sütunlardan kopyaları kaldırın

Veri kümesindeki tüm sütunlarda yinelenen değerlere sahip satırları kaldırmak için aşağıdaki kodu kullanabiliriz:

 /*create dataset with no duplicate rows*/
proc sort data =original_data out =no_dups_data nodupkey ;
    by _all_;
run ;

/*view dataset with no duplicate rows*/
proc print data =no_dups_data; 

Orijinal veri kümesinden toplam beş yinelenen satırın kaldırıldığını unutmayın.

Örnek 2: Belirli sütunlardaki kopyaları kaldırın

Kopyaları kaldırırken hangi sütunların inceleneceğini belirtmek için by argümanını kullanabiliriz.

Örneğin, aşağıdaki kod, ekip ve konum sütunlarındaki yinelenen değerlere sahip satırları kaldırır:

 /*create dataset with no duplicate rows in team and position columns*/
proc sort data =original_data out =no_dups_data nodupkey ;
    by team position;
run ;

/*view dataset with no duplicate rows in team and position columns*/
proc print data =no_dups_data; 

Takım ve konum sütunlarında yinelenen değerlere sahip satırlar kaldırıldıktan sonra veri kümesinde yalnızca dört satır kalır.

Ek kaynaklar

Aşağıdaki eğitimlerde SAS’ta diğer yaygın işlemlerin nasıl gerçekleştirileceği açıklanmaktadır:

SAS’taki veriler nasıl normalleştirilir?
SAS’ta aykırı değerler nasıl belirlenir
SAS’ta prosedür özeti nasıl kullanılır?
SAS’ta frekans tabloları nasıl oluşturulur?

Yorum ekle

E-posta hesabınız yayımlanmayacak. Gerekli alanlar * ile işaretlenmişlerdir