วิธีการคำนวณความสัมพันธ์ใน sas (พร้อมตัวอย่าง)


วิธีหนึ่งในการหาปริมาณความสัมพันธ์ระหว่างตัวแปรสองตัวคือการใช้ สัมประสิทธิ์สหสัมพันธ์แบบเพียร์สัน ซึ่งวัดความสัมพันธ์เชิงเส้นระหว่างตัวแปรสอง ตัว

จะใช้ค่าระหว่าง -1 ถึง 1 เสมอโดยที่:

  • -1 บ่งชี้ถึงความสัมพันธ์เชิงเส้นเชิงลบอย่างสมบูรณ์ระหว่างตัวแปรสองตัว
  • 0 บ่งชี้ว่าไม่มีความสัมพันธ์เชิงเส้นระหว่างตัวแปรสองตัว
  • 1 บ่งชี้ความสัมพันธ์เชิงเส้นเชิงบวกอย่างสมบูรณ์ระหว่างตัวแปรสองตัว

ยิ่งค่าสัมประสิทธิ์สหสัมพันธ์จากศูนย์มากเท่าใด ความสัมพันธ์ระหว่างตัวแปรทั้งสองก็จะยิ่งแข็งแกร่งขึ้นเท่านั้น

ตัวอย่างต่อไปนี้แสดงวิธีใช้ proc corr ใน SAS เพื่อคำนวณค่าสัมประสิทธิ์สหสัมพันธ์ระหว่างตัวแปรในชุดข้อมูลที่ผสานรวมของ SAS ที่เรียกว่า Fish ซึ่งมีการวัดต่างๆ สำหรับปลาที่แตกต่างกัน 159 ตัวที่จับได้ในทะเลสาบในฟินแลนด์

เราสามารถใช้ proc print เพื่อแสดงข้อสังเกต 10 รายการแรกของชุดข้อมูลนี้:

 /*view first 10 observations from Fish dataset*/
proc print data =sashelp.Fish( obs = 10 );

run ;

ตัวอย่างที่ 1: ความสัมพันธ์ระหว่างสองตัวแปร

เราสามารถใช้โค้ดต่อไปนี้เพื่อคำนวณค่าสัมประสิทธิ์สหสัมพันธ์เพียร์สันระหว่างตัวแปรความสูงและความกว้าง:

 /*calculate correlation coefficient between Height and Width*/
proc corr data =sashelp.fish;
	var HeightWidth;

run ;

ตารางแรกจะแสดงสถิติสรุปสำหรับความสูงและความกว้าง

ตารางที่สองแสดงค่าสัมประสิทธิ์สหสัมพันธ์แบบเพียร์สันระหว่างตัวแปรทั้งสอง รวมถึง ค่า p ซึ่งบอกเราว่าความสัมพันธ์นั้นมีนัยสำคัญทางสถิติหรือไม่

จากผลลัพธ์เราจะเห็นได้ว่า:

  • ค่าสัมประสิทธิ์สหสัมพันธ์เพียร์สัน: 0.79288
  • ค่า P: <0.0001

สิ่งนี้บอกเราว่ามีความสัมพันธ์เชิงบวกอย่างมากระหว่างความสูงและความกว้าง และความสัมพันธ์นั้นมีนัยสำคัญทางสถิติ เนื่องจากค่า p น้อยกว่า α = 0.05

ที่เกี่ยวข้อง: อะไรคือความสัมพันธ์ที่ “แข็งแกร่ง”?

ตัวอย่างที่ 2: ความสัมพันธ์ระหว่างตัวแปรทั้งหมด

เราสามารถใช้โค้ดต่อไปนี้เพื่อคำนวณค่าสัมประสิทธิ์สหสัมพันธ์แบบเพียร์สันระหว่างการรวมตัวแปรแบบคู่ทั้งหมดในชุดข้อมูล:

 /*calculate correlation coefficient between all pairwise combinations of variables*/
proc corr data =sashelp.fish;

run;

เมทริกซ์สหสัมพันธ์ใน SAS

ผลลัพธ์จะแสดง เมทริกซ์สหสัมพันธ์ ซึ่งมีค่าสัมประสิทธิ์สหสัมพันธ์แบบเพียร์สันและค่า p ที่สอดคล้องกันสำหรับการรวมตัวแปรตัวเลขในชุดข้อมูลแต่ละคู่ตามลำดับ

ตัวอย่างเช่น:

  • ค่าสัมประสิทธิ์สหสัมพันธ์เพียร์สันระหว่างน้ำหนักและความยาว 1 คือ 0.91644
  • ค่าสัมประสิทธิ์สหสัมพันธ์เพียร์สันระหว่างน้ำหนักและความยาว2 คือ 0.91937
  • ค่าสัมประสิทธิ์สหสัมพันธ์เพียร์สันระหว่างน้ำหนักและความยาว 3 คือ 0.92447

และอื่นๆ

ตัวอย่างที่ 3: แสดงภาพความสัมพันธ์ด้วยแผนภาพกระจาย

นอกจากนี้เรายังสามารถใช้ฟังก์ชัน plots เพื่อสร้าง Scatterplot เพื่อให้เห็นภาพความสัมพันธ์ระหว่างตัวแปรสองตัว:

 /*visualize correlation between Height and Width*/
proc corr data =sashelp.fish plots =scatter( nvar =all);;
	var HeightWidth;

run; 

ในกราฟเราจะเห็นความสัมพันธ์เชิงบวกที่แข็งแกร่งระหว่างความสูงและความกว้าง เมื่อความสูงเพิ่มขึ้น ความกว้างก็มีแนวโน้มเพิ่มขึ้นด้วย

ที่มุมซ้ายบนของกราฟ เรายังสามารถดูการสังเกตทั้งหมดที่ใช้ ค่าสัมประสิทธิ์สหสัมพันธ์ และค่า p ของค่าสัมประสิทธิ์สหสัมพันธ์

แหล่งข้อมูลเพิ่มเติม

บทช่วยสอนต่อไปนี้จะอธิบายวิธีดำเนินการทั่วไปอื่นๆ ใน SAS:

วิธีสร้างตารางความถี่ใน SAS
วิธีการคำนวณสถิติเชิงพรรณนาใน SAS

เพิ่มความคิดเห็น

อีเมลของคุณจะไม่แสดงให้คนอื่นเห็น ช่องข้อมูลจำเป็นถูกทำเครื่องหมาย *