วิธีการคำนวณความสัมพันธ์บางส่วนใน r
ในสถิติ เรามักจะใช้ สัมประสิทธิ์สหสัมพันธ์แบบเพียร์สัน เพื่อวัดความสัมพันธ์เชิงเส้นระหว่างตัวแปรสองตัว
อย่างไรก็ตาม บางครั้งเราต้องการเข้าใจความสัมพันธ์ระหว่างตัวแปรสองตัว ในขณะที่ควบคุมตัวแปรตัวที่สาม
ตัวอย่างเช่น สมมติว่าเราต้องการวัดความสัมพันธ์ระหว่างจำนวนชั่วโมงเรียนของนักเรียนกับเกรดการสอบปลายภาค ขณะเดียวกันก็ควบคุมเกรดปัจจุบันของนักเรียนในชั้นเรียน
ในกรณีนี้ เราสามารถใช้ ความสัมพันธ์บางส่วน เพื่อวัดความสัมพันธ์ระหว่างชั่วโมงเรียนกับคะแนนสอบปลายภาค
บทช่วยสอนนี้จะอธิบายวิธีคำนวณความสัมพันธ์บางส่วนใน R
ตัวอย่าง: ความสัมพันธ์บางส่วนใน R
สมมติว่าเรามีกรอบข้อมูลต่อไปนี้ที่แสดงเกรดปัจจุบัน จำนวนชั่วโมงเรียนทั้งหมด และเกรดการสอบปลายภาคสำหรับนักเรียน 10 คน:
#create data frame df <- data. frame (currentGrade = c(82, 88, 75, 74, 93, 97, 83, 90, 90, 80), hours = c(4, 3, 6, 5, 4, 5, 8, 7, 4, 6), examScore = c(88, 85, 76, 70, 92, 94, 89, 85, 90, 93)) #view data frame df currentGrade hours examScore 1 82 4 88 2 88 3 85 3 75 6 76 4 74 5 70 5 93 4 92 6 97 5 94 7 83 8 89 8 90 7 85 9 90 4 90 10 80 6 93
ในการคำนวณความสัมพันธ์บางส่วนระหว่างการรวมตัวแปรแต่ละคู่ใน dataframe เราสามารถใช้ฟังก์ชัน pcor() จาก ไลบรารี ppcor :
library (ppcor)
#calculate partial correlations
pcor(df)
$estimate
currentGrade hours examScore
currentGrade 1.0000000 -0.3112341 0.7355673
hours -0.3112341 1.0000000 0.1906258
examScore 0.7355673 0.1906258 1.0000000
$p.value
currentGrade hours examScore
currentGrade 0.00000000 0.4149353 0.02389896
hours 0.41493532 0.0000000 0.62322848
examScore 0.02389896 0.6232285 0.00000000
$statistic
currentGrade hours examScore
currentGrade 0.0000000 -0.8664833 2.8727185
hours -0.8664833 0.0000000 0.5137696
examScore 2.8727185 0.5137696 0.0000000
$n
[1] 10
$gp
[1] 1
$method
[1] "pearson"
ต่อไปนี้เป็นวิธีการตีความผลลัพธ์:
ความสัมพันธ์บางส่วนระหว่างชั่วโมงที่เรียนกับเกรดการสอบปลายภาค:
ความสัมพันธ์บางส่วนระหว่างชั่วโมงเรียนกับคะแนนสอบปลายภาคคือ 0.191 ซึ่งแสดงถึงความสัมพันธ์เชิงบวกเล็กน้อย เมื่อจำนวนชั่วโมงเรียนเพิ่มขึ้น คะแนนสอบก็มีแนวโน้มเพิ่มขึ้นเช่นกัน โดยถือว่าเกรดปัจจุบันคงที่
ค่า p สำหรับความสัมพันธ์บางส่วนนี้คือ 0.623 ซึ่งไม่มีนัยสำคัญทางสถิติที่ α = 0.05
ความสัมพันธ์บางส่วนระหว่างเกรดปัจจุบันและเกรดการสอบปลายภาค:
ความสัมพันธ์บางส่วนระหว่างเกรดปัจจุบันและเกรดการสอบปลายภาคคือ 0.736 ซึ่งแสดงถึงความสัมพันธ์เชิงบวกที่แข็งแกร่ง เมื่อเกรดปัจจุบันเพิ่มขึ้น คะแนนสอบก็มีแนวโน้มเพิ่มขึ้นเช่นกัน โดยสมมติว่าจำนวนชั่วโมงที่เรียนคงที่
ค่า p สำหรับความสัมพันธ์บางส่วนนี้คือ 0.024 ซึ่งมีนัยสำคัญทางสถิติที่ α = 0.05
ความสัมพันธ์บางส่วนระหว่างเกรดปัจจุบันกับชั่วโมงเรียน:
ความสัมพันธ์บางส่วนระหว่างเกรดปัจจุบัน ชั่วโมงเรียน และเกรดการสอบปลายภาคคือ -0.311 ซึ่งแสดงถึงความสัมพันธ์เชิงลบเล็กน้อย เมื่อเกรดปัจจุบันเพิ่มขึ้น เกรดการสอบปลายภาคมีแนวโน้มลดลง โดยถือว่าเกรดการสอบปลายภาคคงที่
ค่า p สำหรับความสัมพันธ์บางส่วนนี้คือ 0.415 ซึ่งไม่มีนัยสำคัญทางสถิติที่ α = 0.05
ผลลัพธ์ยังบอกเราด้วยว่าวิธีที่ใช้ในการคำนวณความสัมพันธ์บางส่วนคือ “เพียร์สัน”
ในฟังก์ชัน pcor() เรายังสามารถระบุ “kendall” หรือ “pearson” เป็นวิธีอื่นในการคำนวณความสัมพันธ์ได้
แหล่งข้อมูลเพิ่มเติม
บทช่วยสอนต่อไปนี้จะอธิบายวิธีดำเนินการงานทั่วไปอื่นๆ ใน R:
วิธีการคำนวณความสัมพันธ์ของอันดับ Spearman ใน R
วิธีการคำนวณความสัมพันธ์ข้ามใน R
วิธีการคำนวณความสัมพันธ์แบบเลื่อนใน R
วิธีการคำนวณความสัมพันธ์แบบพอยต์-ไบซีเรียลใน R