วิธีใช้ proc compare ใน sas (พร้อมตัวอย่าง)


คุณสามารถใช้ PROC COMPARE ใน SAS เพื่อระบุความเหมือนและความแตกต่างระหว่างชุดข้อมูลสองชุดได้อย่างรวดเร็ว

ขั้นตอนนี้ใช้ไวยากรณ์พื้นฐานต่อไปนี้:

 proc compare
    base =data1
    compare =data2;
run ;

ตัวอย่างต่อไปนี้แสดงวิธีการใช้ขั้นตอนนี้ในทางปฏิบัติ

ตัวอย่าง: การใช้ Proc Compare ใน SAS

สมมติว่าเรามีข้อมูลสองชุดต่อไปนี้ใน SAS:

 /*create datasets*/
data data1;
    input team $pointsrebounds;
    datalines ;
At 25 10
B 18 4
C 18 7
D 24 12
E 27 11
;
run ;

data data2;
    input team $points;
    datalines ;
At 25
B 18
F 27
G21
H 20
;
run ;

/*view datasets*/
proc print data =data1;
proc print data =data2; 

เราสามารถใช้คำสั่ง PROC COMPARE ต่อไปนี้เพื่อค้นหาความเหมือนและความแตกต่างระหว่างชุดข้อมูลทั้งสองชุด:

 /*compare the two datasets*/
proc compare
    base =data1
    compare =data2;
run ;

สิ่งนี้จะสร้างตารางสามตารางในเอาต์พุต:

ตารางที่ 1: สรุปทั้งสองตาราง

ตารางแรกให้ข้อมูลสรุปโดยย่อของแต่ละชุดข้อมูล ได้แก่:

1. จำนวนตัวแปร (NVar) และการสังเกต (NObs) ในแต่ละชุดข้อมูล

  • Data1 มี 3 ตัวแปรและ 5 การสังเกต
  • Data2 มี 2 ตัวแปรและ 5 การสังเกต

2. จำนวนตัวแปรทั่วไประหว่างชุดข้อมูลทั้งสองชุด

  • Data1 และ Data2 มี 2 ตัวแปรที่เหมือนกัน (ทีมและคะแนน)

ตารางที่ 2: สรุปจำนวนผลต่างของค่า

ตารางที่สองสรุปจำนวนความแตกต่างในค่าระหว่างสองตาราง

ส่วนที่น่าสนใจที่สุดของเอาต์พุตนี้อยู่ที่ส่วนท้ายของตาราง ซึ่งเราสามารถดูสรุปความแตกต่างระหว่างตัวแปรได้:

  • ตัวแปร ทีม มีการสังเกต 3 รายการที่มีค่าต่างกัน
  • ตัวแปร จุด มีการสังเกต 3 แบบที่มีค่าต่างกัน ผลต่างสูงสุดคือ 9

ตารางที่ 3: ความแตกต่างที่แท้จริงระหว่างการสังเกต

ตารางที่สามแสดงความแตกต่างที่แท้จริงระหว่างการสังเกตในชุดข้อมูลทั้งสองชุด

ตารางแรกแสดงความแตกต่างของตัวแปร ทีม ระหว่างชุดข้อมูลทั้งสองชุด

  • ตัวอย่างเช่น ใน data1 การสังเกตครั้งที่สามมีค่าเป็น C สำหรับทีม ในขณะที่อยู่ใน data2 การสังเกตครั้งที่สามมีค่าเป็น F

ตารางที่สองแสดงความแตกต่างของตัวแปร จุด ระหว่างชุดข้อมูลทั้งสองชุด

  • ตัวอย่างเช่น ใน data1 การสังเกตครั้งที่สามมีค่าเป็น 18 สำหรับจุด ในขณะที่ data2 การสังเกตครั้งที่สามมีค่าเป็น 27 ความแตกต่างระหว่างสองค่าคือ 9 .

ตารางทั้งสามนี้ทำให้เราเข้าใจถึงความแตกต่างระหว่างชุดข้อมูลทั้งสองได้อย่างครบถ้วน

โปรดทราบว่าหากคุณต้องการเปรียบเทียบเฉพาะความแตกต่างระหว่างชุดข้อมูลสองชุดสำหรับตัวแปรเฉพาะ คุณสามารถใช้ไวยากรณ์ต่อไปนี้:

 /*compare the differences between the datasets only for 'points' variable*/
proc compare
    base =data1
    compare =data2;
var points;
run ;

สิ่งนี้จะสร้างตารางสามตารางเหมือนเดิม แต่จะแสดงเฉพาะเอาต์พุตของตัวแปร จุด เท่านั้น

หมายเหตุ : คุณสามารถดูเอกสาร PROC COMPARE ฉบับเต็ม ได้ที่นี่

แหล่งข้อมูลเพิ่มเติม

บทช่วยสอนต่อไปนี้จะอธิบายวิธีดำเนินการงานทั่วไปอื่นๆ ใน SAS:

วิธีใช้สรุปขั้นตอนใน SAS
วิธีใช้ Proc Tabulate ใน SAS
วิธีใช้การจัดเรียง Proc ใน SAS

เพิ่มความคิดเห็น

อีเมลของคุณจะไม่แสดงให้คนอื่นเห็น ช่องข้อมูลจำเป็นถูกทำเครื่องหมาย *