วิธีสร้างเมทริกซ์สหสัมพันธ์ใน sas (พร้อมตัวอย่าง)
เมทริกซ์สหสัมพันธ์ คือตารางสี่เหลี่ยมที่แสดง ค่าสัมประสิทธิ์สหสัมพันธ์ ระหว่างตัวแปรในชุดข้อมูล
โดยให้วิธีที่รวดเร็วในการทำความเข้าใจจุดแข็งของความสัมพันธ์เชิงเส้นที่มีอยู่ระหว่างตัวแปรในชุดข้อมูล
คุณสามารถใช้คำสั่ง PROC CORR ใน SAS เพื่อสร้างเมทริกซ์สหสัมพันธ์สำหรับชุดข้อมูลที่กำหนด:
/*create correlation matrix using all numeric variables in my_data*/
proc corr data =my_data;
run ;
ตามค่าเริ่มต้น สิ่งนี้จะสร้างเมทริกซ์ที่แสดงค่าสัมประสิทธิ์สหสัมพันธ์ระหว่างตัวแปรตัวเลขทั้งหมดในชุดข้อมูล
หากต้องการรวมเฉพาะตัวแปรที่ระบุในเมทริกซ์สหสัมพันธ์ คุณสามารถใช้คำสั่ง VAR ได้:
/*create correlation matrix using only var1, var2 and var3 in my_data*/
proc corr data =my_data;
var var1, var2, var3;
run ;
ตัวอย่างต่อไปนี้แสดงวิธีสร้างเมทริกซ์สหสัมพันธ์ใน SAS
ตัวอย่าง: การสร้างเมทริกซ์สหสัมพันธ์ใน SAS
สมมติว่าเรามีชุดข้อมูลต่อไปนี้ใน SAS ที่มีข้อมูลเกี่ยวกับผู้เล่นบาสเกตบอลต่างๆ:
/*create dataset*/
data my_data;
input team $ assists rebounds points;
datalines ;
A 4 12 22
A 5 14 24
A 5 13 26
A 6 7 26
B 7 8 29
B 8 8 32
B 8 9 20
B 10 13 14
;
run ;
/*view dataset*/
proc print data =my_data;
เราสามารถใช้คำสั่ง PROC CORR เพื่อสร้างเมทริกซ์สหสัมพันธ์ที่รวมตัวแปรตัวเลขทุกตัวในชุดข้อมูลตามค่าเริ่มต้น:
/*create correlation matrix using all numeric variables in my_data*/
proc corr data =my_data;
run ;
ผลลัพธ์จะแสดงสถิติสรุปของตัวแปรตัวเลขในตารางแรกพร้อมกับเมทริกซ์สหสัมพันธ์
โปรดทราบว่าตัวแปร “ทีม” ไม่ได้รวมอยู่ในเมทริกซ์สหสัมพันธ์เนื่องจากไม่ใช่ตัวแปรตัวเลข
วิธีตีความค่าเมทริกซ์สหสัมพันธ์มีดังนี้
(1) ค่าสัมประสิทธิ์สหสัมพันธ์เพียร์สัน (r) ระหว่าง แอสซิสต์ และ การรีบาวด์ คือ -0.24486 ค่า p ที่สอดคล้องกันคือ 0.5589
เนื่องจาก r น้อยกว่าศูนย์ นี่บอกเราว่ามีความสัมพันธ์เชิงเส้นเป็นลบระหว่างตัวแปรทั้งสองนี้ อย่างไรก็ตาม ค่า p-value ไม่น้อยกว่า 0.05 ดังนั้นความสัมพันธ์นี้จึงไม่มีนัยสำคัญทางสถิติ
(2) ค่าสัมประสิทธิ์สหสัมพันธ์เพียร์สัน (r) ระหว่าง การแอสซิสต์ และ คะแนน คือ -0.32957 ค่า p ที่สอดคล้องกันคือ 0.4253
มีความสัมพันธ์เชิงเส้นเชิงลบระหว่างตัวแปรทั้งสองนี้ แต่ไม่มีนัยสำคัญทางสถิติ
(3) ค่าสัมประสิทธิ์สหสัมพันธ์เพียร์สัน (r) ระหว่าง การรีบาวด์ และ คะแนน คือ -0.52209 ค่า p ที่สอดคล้องกันคือ 0.1844
มีความสัมพันธ์เชิงเส้นเชิงลบระหว่างตัวแปรทั้งสองนี้ แต่ไม่มีนัยสำคัญทางสถิติ
โปรดทราบว่าเรายังสามารถใช้คำสั่ง VAR เพื่อรวมเฉพาะตัวแปรตัวเลขที่ระบุในเมทริกซ์สหสัมพันธ์ได้:
/*create correlation matrix using only assists and rebounds variables*/
proc corr data =my_data;
var assists rebounds;
run ;
โปรดทราบว่ามีเพียงตัวแปร ช่วยเหลือ และ รีบา วด์เท่านั้นที่รวมอยู่ในเมทริกซ์สหสัมพันธ์นี้
แหล่งข้อมูลเพิ่มเติม
บทช่วยสอนต่อไปนี้จะอธิบายวิธีดำเนินการงานทั่วไปอื่นๆ ใน SAS:
วิธีสร้างเมทริกซ์ Scatterplot ใน SAS
วิธีสร้าง PivotTable ใน SAS
วิธีการคำนวณ Variance Inflation Factor (VIF) ใน SAS