Sas'ta proc compare nasıl kullanılır (örneklerle)
İki veri kümesi arasındaki benzerlikleri ve farklılıkları hızla belirlemek için SAS’ta PROC COMPARE’i kullanabilirsiniz.
Bu prosedür aşağıdaki temel sözdizimini kullanır:
proc compare base =data1 compare =data2; run ;
Aşağıdaki örnekte bu prosedürün pratikte nasıl kullanılacağı gösterilmektedir.
Örnek: SAS’ta Proc Compare’i kullanma
SAS’ta aşağıdaki iki veri kümesine sahip olduğumuzu varsayalım:
/*create datasets*/
data data1;
input team $pointsrebounds;
datalines ;
At 25 10
B 18 4
C 18 7
D 24 12
E 27 11
;
run ;
data data2;
input team $points;
datalines ;
At 25
B 18
F 27
G21
H 20
;
run ;
/*view datasets*/
proc print data =data1;
proc print data =data2;
İki veri seti arasındaki benzerlikleri ve farklılıkları bulmak için aşağıdaki PROC COMPARE ifadesini kullanabiliriz:
/*compare the two datasets*/
proc compare
base =data1
compare =data2;
run ;
Bu, çıktıda üç tablo üretecektir:
Tablo 1: İki tablonun özeti
İlk tablo, aşağıdakiler de dahil olmak üzere her veri kümesinin kısa bir özetini sağlar:
1. Her veri setindeki değişkenlerin (NVar) ve gözlemlerin (NObs) sayısı.
- Veri1’de 3 değişken ve 5 gözlem bulunur
- Data2’de 2 değişken ve 5 gözlem var
2. İki veri seti arasındaki ortak değişkenlerin sayısı.
- Veri1 ve Veri2’nin ortak 2 değişkeni vardır (takım ve puanlar)
Tablo 2: Değer farklılıklarının sayısının özeti
İkinci tablo, iki tablo arasındaki değerlerdeki farkların sayısını özetlemektedir.
Bu çıktının en ilginç kısmı, değişkenler arasındaki farkların bir özetini görebildiğimiz tablonun sonundadır:
- Takım değişkeninin farklı değerlere sahip 3 gözlemi vardır.
- Nokta değişkenleri farklı değerlere sahip 3 gözleme sahiptir. Maksimum fark 9’dur.
Tablo 3: Gözlemler arasındaki gerçek farklar
Üçüncü tablo, iki veri kümesindeki gözlemler arasındaki gerçek farklılıkları göstermektedir.
İlk tablo, iki veri kümesi arasındaki ekip değişkeni farklarını gösterir.
- Örneğin veri1’de üçüncü gözlem takım için C değerine sahipken veri2’de üçüncü gözlem F değerine sahiptir.
İkinci tablo, iki veri kümesi arasındaki nokta değişkenlerindeki farklılıkları gösterir.
- Örneğin, veri1’de üçüncü gözlemin puan değeri 18 iken veri2’de üçüncü gözlemin değeri 27’dir . İki değer arasındaki fark 9’dur .
Bu üç tablo bize iki veri seti arasındaki farkları tam olarak anlamamızı sağlar.
Belirli bir değişken için yalnızca iki veri kümesi arasındaki farkları karşılaştırmak istiyorsanız aşağıdaki sözdizimini kullanabileceğinizi unutmayın:
/*compare the differences between the datasets only for 'points' variable*/
proc compare
base =data1
compare =data2;
var points;
run ;
Bu, öncekiyle aynı üç tabloyu üretecektir, ancak yalnızca puan değişkeninin çıktısı görüntülenecektir.
Not : PROC COMPARE belgelerinin tamamını burada bulabilirsiniz.
Ek kaynaklar
Aşağıdaki eğitimlerde SAS’ta diğer ortak görevlerin nasıl gerçekleştirileceği açıklanmaktadır:
SAS’ta prosedür özeti nasıl kullanılır?
SAS’ta Proc Tabulate nasıl kullanılır?
SAS’ta Proc harmanlaması nasıl kullanılır?