วิธีใช้ proc compare ใน sas (พร้อมตัวอย่าง)
คุณสามารถใช้ PROC COMPARE ใน SAS เพื่อระบุความเหมือนและความแตกต่างระหว่างชุดข้อมูลสองชุดได้อย่างรวดเร็ว
ขั้นตอนนี้ใช้ไวยากรณ์พื้นฐานต่อไปนี้:
proc compare base =data1 compare =data2; run ;
ตัวอย่างต่อไปนี้แสดงวิธีการใช้ขั้นตอนนี้ในทางปฏิบัติ
ตัวอย่าง: การใช้ Proc Compare ใน SAS
สมมติว่าเรามีข้อมูลสองชุดต่อไปนี้ใน SAS:
/*create datasets*/
data data1;
input team $pointsrebounds;
datalines ;
At 25 10
B 18 4
C 18 7
D 24 12
E 27 11
;
run ;
data data2;
input team $points;
datalines ;
At 25
B 18
F 27
G21
H 20
;
run ;
/*view datasets*/
proc print data =data1;
proc print data =data2;
เราสามารถใช้คำสั่ง PROC COMPARE ต่อไปนี้เพื่อค้นหาความเหมือนและความแตกต่างระหว่างชุดข้อมูลทั้งสองชุด:
/*compare the two datasets*/
proc compare
base =data1
compare =data2;
run ;
สิ่งนี้จะสร้างตารางสามตารางในเอาต์พุต:
ตารางที่ 1: สรุปทั้งสองตาราง
ตารางแรกให้ข้อมูลสรุปโดยย่อของแต่ละชุดข้อมูล ได้แก่:
1. จำนวนตัวแปร (NVar) และการสังเกต (NObs) ในแต่ละชุดข้อมูล
- Data1 มี 3 ตัวแปรและ 5 การสังเกต
- Data2 มี 2 ตัวแปรและ 5 การสังเกต
2. จำนวนตัวแปรทั่วไประหว่างชุดข้อมูลทั้งสองชุด
- Data1 และ Data2 มี 2 ตัวแปรที่เหมือนกัน (ทีมและคะแนน)
ตารางที่ 2: สรุปจำนวนผลต่างของค่า
ตารางที่สองสรุปจำนวนความแตกต่างในค่าระหว่างสองตาราง
ส่วนที่น่าสนใจที่สุดของเอาต์พุตนี้อยู่ที่ส่วนท้ายของตาราง ซึ่งเราสามารถดูสรุปความแตกต่างระหว่างตัวแปรได้:
- ตัวแปร ทีม มีการสังเกต 3 รายการที่มีค่าต่างกัน
- ตัวแปร จุด มีการสังเกต 3 แบบที่มีค่าต่างกัน ผลต่างสูงสุดคือ 9
ตารางที่ 3: ความแตกต่างที่แท้จริงระหว่างการสังเกต
ตารางที่สามแสดงความแตกต่างที่แท้จริงระหว่างการสังเกตในชุดข้อมูลทั้งสองชุด
ตารางแรกแสดงความแตกต่างของตัวแปร ทีม ระหว่างชุดข้อมูลทั้งสองชุด
- ตัวอย่างเช่น ใน data1 การสังเกตครั้งที่สามมีค่าเป็น C สำหรับทีม ในขณะที่อยู่ใน data2 การสังเกตครั้งที่สามมีค่าเป็น F
ตารางที่สองแสดงความแตกต่างของตัวแปร จุด ระหว่างชุดข้อมูลทั้งสองชุด
- ตัวอย่างเช่น ใน data1 การสังเกตครั้งที่สามมีค่าเป็น 18 สำหรับจุด ในขณะที่ data2 การสังเกตครั้งที่สามมีค่าเป็น 27 ความแตกต่างระหว่างสองค่าคือ 9 .
ตารางทั้งสามนี้ทำให้เราเข้าใจถึงความแตกต่างระหว่างชุดข้อมูลทั้งสองได้อย่างครบถ้วน
โปรดทราบว่าหากคุณต้องการเปรียบเทียบเฉพาะความแตกต่างระหว่างชุดข้อมูลสองชุดสำหรับตัวแปรเฉพาะ คุณสามารถใช้ไวยากรณ์ต่อไปนี้:
/*compare the differences between the datasets only for 'points' variable*/
proc compare
base =data1
compare =data2;
var points;
run ;
สิ่งนี้จะสร้างตารางสามตารางเหมือนเดิม แต่จะแสดงเฉพาะเอาต์พุตของตัวแปร จุด เท่านั้น
หมายเหตุ : คุณสามารถดูเอกสาร PROC COMPARE ฉบับเต็ม ได้ที่นี่
แหล่งข้อมูลเพิ่มเติม
บทช่วยสอนต่อไปนี้จะอธิบายวิธีดำเนินการงานทั่วไปอื่นๆ ใน SAS:
วิธีใช้สรุปขั้นตอนใน SAS
วิธีใช้ Proc Tabulate ใน SAS
วิธีใช้การจัดเรียง Proc ใน SAS