วิธีการคำนวณความสัมพันธ์ใน sas (พร้อมตัวอย่าง)
วิธีหนึ่งในการหาปริมาณความสัมพันธ์ระหว่างตัวแปรสองตัวคือการใช้ สัมประสิทธิ์สหสัมพันธ์แบบเพียร์สัน ซึ่งวัดความสัมพันธ์เชิงเส้นระหว่างตัวแปรสอง ตัว
จะใช้ค่าระหว่าง -1 ถึง 1 เสมอโดยที่:
- -1 บ่งชี้ถึงความสัมพันธ์เชิงเส้นเชิงลบอย่างสมบูรณ์ระหว่างตัวแปรสองตัว
- 0 บ่งชี้ว่าไม่มีความสัมพันธ์เชิงเส้นระหว่างตัวแปรสองตัว
- 1 บ่งชี้ความสัมพันธ์เชิงเส้นเชิงบวกอย่างสมบูรณ์ระหว่างตัวแปรสองตัว
ยิ่งค่าสัมประสิทธิ์สหสัมพันธ์จากศูนย์มากเท่าใด ความสัมพันธ์ระหว่างตัวแปรทั้งสองก็จะยิ่งแข็งแกร่งขึ้นเท่านั้น
ตัวอย่างต่อไปนี้แสดงวิธีใช้ proc corr ใน SAS เพื่อคำนวณค่าสัมประสิทธิ์สหสัมพันธ์ระหว่างตัวแปรในชุดข้อมูลที่ผสานรวมของ SAS ที่เรียกว่า Fish ซึ่งมีการวัดต่างๆ สำหรับปลาที่แตกต่างกัน 159 ตัวที่จับได้ในทะเลสาบในฟินแลนด์
เราสามารถใช้ proc print เพื่อแสดงข้อสังเกต 10 รายการแรกของชุดข้อมูลนี้:
/*view first 10 observations from Fish dataset*/ proc print data =sashelp.Fish( obs = 10 ); run ;
ตัวอย่างที่ 1: ความสัมพันธ์ระหว่างสองตัวแปร
เราสามารถใช้โค้ดต่อไปนี้เพื่อคำนวณค่าสัมประสิทธิ์สหสัมพันธ์เพียร์สันระหว่างตัวแปรความสูงและความกว้าง:
/*calculate correlation coefficient between Height and Width*/ proc corr data =sashelp.fish; var HeightWidth; run ;
ตารางแรกจะแสดงสถิติสรุปสำหรับความสูงและความกว้าง
ตารางที่สองแสดงค่าสัมประสิทธิ์สหสัมพันธ์แบบเพียร์สันระหว่างตัวแปรทั้งสอง รวมถึง ค่า p ซึ่งบอกเราว่าความสัมพันธ์นั้นมีนัยสำคัญทางสถิติหรือไม่
จากผลลัพธ์เราจะเห็นได้ว่า:
- ค่าสัมประสิทธิ์สหสัมพันธ์เพียร์สัน: 0.79288
- ค่า P: <0.0001
สิ่งนี้บอกเราว่ามีความสัมพันธ์เชิงบวกอย่างมากระหว่างความสูงและความกว้าง และความสัมพันธ์นั้นมีนัยสำคัญทางสถิติ เนื่องจากค่า p น้อยกว่า α = 0.05
ที่เกี่ยวข้อง: อะไรคือความสัมพันธ์ที่ “แข็งแกร่ง”?
ตัวอย่างที่ 2: ความสัมพันธ์ระหว่างตัวแปรทั้งหมด
เราสามารถใช้โค้ดต่อไปนี้เพื่อคำนวณค่าสัมประสิทธิ์สหสัมพันธ์แบบเพียร์สันระหว่างการรวมตัวแปรแบบคู่ทั้งหมดในชุดข้อมูล:
/*calculate correlation coefficient between all pairwise combinations of variables*/ proc corr data =sashelp.fish; run;
ผลลัพธ์จะแสดง เมทริกซ์สหสัมพันธ์ ซึ่งมีค่าสัมประสิทธิ์สหสัมพันธ์แบบเพียร์สันและค่า p ที่สอดคล้องกันสำหรับการรวมตัวแปรตัวเลขในชุดข้อมูลแต่ละคู่ตามลำดับ
ตัวอย่างเช่น:
- ค่าสัมประสิทธิ์สหสัมพันธ์เพียร์สันระหว่างน้ำหนักและความยาว 1 คือ 0.91644
- ค่าสัมประสิทธิ์สหสัมพันธ์เพียร์สันระหว่างน้ำหนักและความยาว2 คือ 0.91937
- ค่าสัมประสิทธิ์สหสัมพันธ์เพียร์สันระหว่างน้ำหนักและความยาว 3 คือ 0.92447
และอื่นๆ
ตัวอย่างที่ 3: แสดงภาพความสัมพันธ์ด้วยแผนภาพกระจาย
นอกจากนี้เรายังสามารถใช้ฟังก์ชัน plots เพื่อสร้าง Scatterplot เพื่อให้เห็นภาพความสัมพันธ์ระหว่างตัวแปรสองตัว:
/*visualize correlation between Height and Width*/ proc corr data =sashelp.fish plots =scatter( nvar =all);; var HeightWidth; run;
ในกราฟเราจะเห็นความสัมพันธ์เชิงบวกที่แข็งแกร่งระหว่างความสูงและความกว้าง เมื่อความสูงเพิ่มขึ้น ความกว้างก็มีแนวโน้มเพิ่มขึ้นด้วย
ที่มุมซ้ายบนของกราฟ เรายังสามารถดูการสังเกตทั้งหมดที่ใช้ ค่าสัมประสิทธิ์สหสัมพันธ์ และค่า p ของค่าสัมประสิทธิ์สหสัมพันธ์
แหล่งข้อมูลเพิ่มเติม
บทช่วยสอนต่อไปนี้จะอธิบายวิธีดำเนินการทั่วไปอื่นๆ ใน SAS:
วิธีสร้างตารางความถี่ใน SAS
วิธีการคำนวณสถิติเชิงพรรณนาใน SAS