Sas'taki kopyalar nasıl kaldırılır (örneklerle)
Bir veri kümesinden yinelenen satırları hızla kaldırmak için SAS’ta proc sort’u kullanabilirsiniz.
Bu prosedür aşağıdaki temel sözdizimini kullanır:
proc sort data =original_data out =no_dups_data nodupkey ;
by _all_;
run;
By bağımsız değişkeninin, kopyaları kaldırırken hangi sütunların taranacağını belirttiğini unutmayın.
Aşağıdaki örnekler, SAS’ta aşağıdaki veri kümesindeki kopyaların nasıl kaldırılacağını gösterir:
/*create dataset*/
data original_data;
input team $position $points;
datalines ;
A Guard 12
A Guard 20
A Guard 20
A Guard 24
A Forward 15
A Forward 15
A Forward 19
A Forward 28
B Guard 10
B Guard 12
B Guard 12
B Guard 26
B Forward 10
B Forward 10
B Forward 10
B Forward 19
;
run ;
/*view dataset*/
proc print data = original_data;
Örnek 1: Tüm sütunlardan kopyaları kaldırın
Veri kümesindeki tüm sütunlarda yinelenen değerlere sahip satırları kaldırmak için aşağıdaki kodu kullanabiliriz:
/*create dataset with no duplicate rows*/
proc sort data =original_data out =no_dups_data nodupkey ;
by _all_;
run ;
/*view dataset with no duplicate rows*/
proc print data =no_dups_data;
Orijinal veri kümesinden toplam beş yinelenen satırın kaldırıldığını unutmayın.
Örnek 2: Belirli sütunlardaki kopyaları kaldırın
Kopyaları kaldırırken hangi sütunların inceleneceğini belirtmek için by argümanını kullanabiliriz.
Örneğin, aşağıdaki kod, ekip ve konum sütunlarındaki yinelenen değerlere sahip satırları kaldırır:
/*create dataset with no duplicate rows in team and position columns*/
proc sort data =original_data out =no_dups_data nodupkey ;
by team position;
run ;
/*view dataset with no duplicate rows in team and position columns*/
proc print data =no_dups_data;
Takım ve konum sütunlarında yinelenen değerlere sahip satırlar kaldırıldıktan sonra veri kümesinde yalnızca dört satır kalır.
Ek kaynaklar
Aşağıdaki eğitimlerde SAS’ta diğer yaygın işlemlerin nasıl gerçekleştirileceği açıklanmaktadır:
SAS’taki veriler nasıl normalleştirilir?
SAS’ta aykırı değerler nasıl belirlenir
SAS’ta prosedür özeti nasıl kullanılır?
SAS’ta frekans tabloları nasıl oluşturulur?