วิธีสร้างเมทริกซ์สหสัมพันธ์ใน sas (พร้อมตัวอย่าง)


เมทริกซ์สหสัมพันธ์ คือตารางสี่เหลี่ยมที่แสดง ค่าสัมประสิทธิ์สหสัมพันธ์ ระหว่างตัวแปรในชุดข้อมูล

โดยให้วิธีที่รวดเร็วในการทำความเข้าใจจุดแข็งของความสัมพันธ์เชิงเส้นที่มีอยู่ระหว่างตัวแปรในชุดข้อมูล

คุณสามารถใช้คำสั่ง PROC CORR ใน SAS เพื่อสร้างเมทริกซ์สหสัมพันธ์สำหรับชุดข้อมูลที่กำหนด:

 /*create correlation matrix using all numeric variables in my_data*/
proc corr data =my_data;
run ;

ตามค่าเริ่มต้น สิ่งนี้จะสร้างเมทริกซ์ที่แสดงค่าสัมประสิทธิ์สหสัมพันธ์ระหว่างตัวแปรตัวเลขทั้งหมดในชุดข้อมูล

หากต้องการรวมเฉพาะตัวแปรที่ระบุในเมทริกซ์สหสัมพันธ์ คุณสามารถใช้คำสั่ง VAR ได้:

 /*create correlation matrix using only var1, var2 and var3 in my_data*/
proc corr data =my_data;
    var var1, var2, var3;
run ;

ตัวอย่างต่อไปนี้แสดงวิธีสร้างเมทริกซ์สหสัมพันธ์ใน SAS

ตัวอย่าง: การสร้างเมทริกซ์สหสัมพันธ์ใน SAS

สมมติว่าเรามีชุดข้อมูลต่อไปนี้ใน SAS ที่มีข้อมูลเกี่ยวกับผู้เล่นบาสเกตบอลต่างๆ:

 /*create dataset*/
data my_data;
    input team $ assists rebounds points;
    datalines ;
A 4 12 22
A 5 14 24
A 5 13 26
A 6 7 26
B 7 8 29
B 8 8 32
B 8 9 20
B 10 13 14
;
run ;

/*view dataset*/
proc print data =my_data; 

เราสามารถใช้คำสั่ง PROC CORR เพื่อสร้างเมทริกซ์สหสัมพันธ์ที่รวมตัวแปรตัวเลขทุกตัวในชุดข้อมูลตามค่าเริ่มต้น:

 /*create correlation matrix using all numeric variables in my_data*/
proc corr data =my_data;
run ; 

เมทริกซ์สหสัมพันธ์ใน SAS

ผลลัพธ์จะแสดงสถิติสรุปของตัวแปรตัวเลขในตารางแรกพร้อมกับเมทริกซ์สหสัมพันธ์

โปรดทราบว่าตัวแปร “ทีม” ไม่ได้รวมอยู่ในเมทริกซ์สหสัมพันธ์เนื่องจากไม่ใช่ตัวแปรตัวเลข

วิธีตีความค่าเมทริกซ์สหสัมพันธ์มีดังนี้

(1) ค่าสัมประสิทธิ์สหสัมพันธ์เพียร์สัน (r) ระหว่าง แอสซิสต์ และ การรีบาวด์ คือ -0.24486 ค่า p ที่สอดคล้องกันคือ 0.5589

เนื่องจาก r น้อยกว่าศูนย์ นี่บอกเราว่ามีความสัมพันธ์เชิงเส้นเป็นลบระหว่างตัวแปรทั้งสองนี้ อย่างไรก็ตาม ค่า p-value ไม่น้อยกว่า 0.05 ดังนั้นความสัมพันธ์นี้จึงไม่มีนัยสำคัญทางสถิติ

(2) ค่าสัมประสิทธิ์สหสัมพันธ์เพียร์สัน (r) ระหว่าง การแอสซิสต์ และ คะแนน คือ -0.32957 ค่า p ที่สอดคล้องกันคือ 0.4253

มีความสัมพันธ์เชิงเส้นเชิงลบระหว่างตัวแปรทั้งสองนี้ แต่ไม่มีนัยสำคัญทางสถิติ

(3) ค่าสัมประสิทธิ์สหสัมพันธ์เพียร์สัน (r) ระหว่าง การรีบาวด์ และ คะแนน คือ -0.52209 ค่า p ที่สอดคล้องกันคือ 0.1844

มีความสัมพันธ์เชิงเส้นเชิงลบระหว่างตัวแปรทั้งสองนี้ แต่ไม่มีนัยสำคัญทางสถิติ

โปรดทราบว่าเรายังสามารถใช้คำสั่ง VAR เพื่อรวมเฉพาะตัวแปรตัวเลขที่ระบุในเมทริกซ์สหสัมพันธ์ได้:

 /*create correlation matrix using only assists and rebounds variables*/
proc corr data =my_data;
    var assists rebounds;
run ; 

โปรดทราบว่ามีเพียงตัวแปร ช่วยเหลือ และ รีบา วด์เท่านั้นที่รวมอยู่ในเมทริกซ์สหสัมพันธ์นี้

แหล่งข้อมูลเพิ่มเติม

บทช่วยสอนต่อไปนี้จะอธิบายวิธีดำเนินการงานทั่วไปอื่นๆ ใน SAS:

วิธีสร้างเมทริกซ์ Scatterplot ใน SAS
วิธีสร้าง PivotTable ใน SAS
วิธีการคำนวณ Variance Inflation Factor (VIF) ใน SAS

เพิ่มความคิดเห็น

อีเมลของคุณจะไม่แสดงให้คนอื่นเห็น ช่องข้อมูลจำเป็นถูกทำเครื่องหมาย *