Sas'ta proc compare nasıl kullanılır (örneklerle)


İki veri kümesi arasındaki benzerlikleri ve farklılıkları hızla belirlemek için SAS’ta PROC COMPARE’i kullanabilirsiniz.

Bu prosedür aşağıdaki temel sözdizimini kullanır:

 proc compare
    base =data1
    compare =data2;
run ;

Aşağıdaki örnekte bu prosedürün pratikte nasıl kullanılacağı gösterilmektedir.

Örnek: SAS’ta Proc Compare’i kullanma

SAS’ta aşağıdaki iki veri kümesine sahip olduğumuzu varsayalım:

 /*create datasets*/
data data1;
    input team $pointsrebounds;
    datalines ;
At 25 10
B 18 4
C 18 7
D 24 12
E 27 11
;
run ;

data data2;
    input team $points;
    datalines ;
At 25
B 18
F 27
G21
H 20
;
run ;

/*view datasets*/
proc print data =data1;
proc print data =data2; 

İki veri seti arasındaki benzerlikleri ve farklılıkları bulmak için aşağıdaki PROC COMPARE ifadesini kullanabiliriz:

 /*compare the two datasets*/
proc compare
    base =data1
    compare =data2;
run ;

Bu, çıktıda üç tablo üretecektir:

Tablo 1: İki tablonun özeti

İlk tablo, aşağıdakiler de dahil olmak üzere her veri kümesinin kısa bir özetini sağlar:

1. Her veri setindeki değişkenlerin (NVar) ve gözlemlerin (NObs) sayısı.

  • Veri1’de 3 değişken ve 5 gözlem bulunur
  • Data2’de 2 değişken ve 5 gözlem var

2. İki veri seti arasındaki ortak değişkenlerin sayısı.

  • Veri1 ve Veri2’nin ortak 2 değişkeni vardır (takım ve puanlar)

Tablo 2: Değer farklılıklarının sayısının özeti

İkinci tablo, iki tablo arasındaki değerlerdeki farkların sayısını özetlemektedir.

Bu çıktının en ilginç kısmı, değişkenler arasındaki farkların bir özetini görebildiğimiz tablonun sonundadır:

  • Takım değişkeninin farklı değerlere sahip 3 gözlemi vardır.
  • Nokta değişkenleri farklı değerlere sahip 3 gözleme sahiptir. Maksimum fark 9’dur.

Tablo 3: Gözlemler arasındaki gerçek farklar

Üçüncü tablo, iki veri kümesindeki gözlemler arasındaki gerçek farklılıkları göstermektedir.

İlk tablo, iki veri kümesi arasındaki ekip değişkeni farklarını gösterir.

  • Örneğin veri1’de üçüncü gözlem takım için C değerine sahipken veri2’de üçüncü gözlem F değerine sahiptir.

İkinci tablo, iki veri kümesi arasındaki nokta değişkenlerindeki farklılıkları gösterir.

  • Örneğin, veri1’de üçüncü gözlemin puan değeri 18 iken veri2’de üçüncü gözlemin değeri 27’dir . İki değer arasındaki fark 9’dur .

Bu üç tablo bize iki veri seti arasındaki farkları tam olarak anlamamızı sağlar.

Belirli bir değişken için yalnızca iki veri kümesi arasındaki farkları karşılaştırmak istiyorsanız aşağıdaki sözdizimini kullanabileceğinizi unutmayın:

 /*compare the differences between the datasets only for 'points' variable*/
proc compare
    base =data1
    compare =data2;
var points;
run ;

Bu, öncekiyle aynı üç tabloyu üretecektir, ancak yalnızca puan değişkeninin çıktısı görüntülenecektir.

Not : PROC COMPARE belgelerinin tamamını burada bulabilirsiniz.

Ek kaynaklar

Aşağıdaki eğitimlerde SAS’ta diğer ortak görevlerin nasıl gerçekleştirileceği açıklanmaktadır:

SAS’ta prosedür özeti nasıl kullanılır?
SAS’ta Proc Tabulate nasıl kullanılır?
SAS’ta Proc harmanlaması nasıl kullanılır?

Yorum ekle

E-posta hesabınız yayımlanmayacak. Gerekli alanlar * ile işaretlenmişlerdir