วิธีการคำนวณความสัมพันธ์บางส่วนใน r


ในสถิติ เรามักจะใช้ สัมประสิทธิ์สหสัมพันธ์แบบเพียร์สัน เพื่อวัดความสัมพันธ์เชิงเส้นระหว่างตัวแปรสองตัว

อย่างไรก็ตาม บางครั้งเราต้องการเข้าใจความสัมพันธ์ระหว่างตัวแปรสองตัว ในขณะที่ควบคุมตัวแปรตัวที่สาม

ตัวอย่างเช่น สมมติว่าเราต้องการวัดความสัมพันธ์ระหว่างจำนวนชั่วโมงเรียนของนักเรียนกับเกรดการสอบปลายภาค ขณะเดียวกันก็ควบคุมเกรดปัจจุบันของนักเรียนในชั้นเรียน

ในกรณีนี้ เราสามารถใช้ ความสัมพันธ์บางส่วน เพื่อวัดความสัมพันธ์ระหว่างชั่วโมงเรียนกับคะแนนสอบปลายภาค

บทช่วยสอนนี้จะอธิบายวิธีคำนวณความสัมพันธ์บางส่วนใน R

ตัวอย่าง: ความสัมพันธ์บางส่วนใน R

สมมติว่าเรามีกรอบข้อมูลต่อไปนี้ที่แสดงเกรดปัจจุบัน จำนวนชั่วโมงเรียนทั้งหมด และเกรดการสอบปลายภาคสำหรับนักเรียน 10 คน:

 #create data frame
df <- data. frame (currentGrade = c(82, 88, 75, 74, 93, 97, 83, 90, 90, 80),
                 hours = c(4, 3, 6, 5, 4, 5, 8, 7, 4, 6),
                 examScore = c(88, 85, 76, 70, 92, 94, 89, 85, 90, 93))

#view data frame
df

   currentGrade hours examScore
1 82 4 88
2 88 3 85
3 75 6 76
4 74 5 70
5 93 4 92
6 97 5 94
7 83 8 89
8 90 7 85
9 90 4 90
10 80 6 93

ในการคำนวณความสัมพันธ์บางส่วนระหว่างการรวมตัวแปรแต่ละคู่ใน dataframe เราสามารถใช้ฟังก์ชัน pcor() จาก ไลบรารี ppcor :

 library (ppcor)

#calculate partial correlations
pcor(df)

$estimate
             currentGrade hours examScore
currentGrade 1.0000000 -0.3112341 0.7355673
hours -0.3112341 1.0000000 0.1906258
examScore 0.7355673 0.1906258 1.0000000

$p.value
             currentGrade hours examScore
currentGrade 0.00000000 0.4149353 0.02389896
hours 0.41493532 0.0000000 0.62322848
examScore 0.02389896 0.6232285 0.00000000

$statistic
             currentGrade hours examScore
currentGrade 0.0000000 -0.8664833 2.8727185
hours -0.8664833 0.0000000 0.5137696
examScore 2.8727185 0.5137696 0.0000000

$n
[1] 10

$gp
[1] 1

$method
[1] "pearson"

ต่อไปนี้เป็นวิธีการตีความผลลัพธ์:

ความสัมพันธ์บางส่วนระหว่างชั่วโมงที่เรียนกับเกรดการสอบปลายภาค:

ความสัมพันธ์บางส่วนระหว่างชั่วโมงเรียนกับคะแนนสอบปลายภาคคือ 0.191 ซึ่งแสดงถึงความสัมพันธ์เชิงบวกเล็กน้อย เมื่อจำนวนชั่วโมงเรียนเพิ่มขึ้น คะแนนสอบก็มีแนวโน้มเพิ่มขึ้นเช่นกัน โดยถือว่าเกรดปัจจุบันคงที่

ค่า p สำหรับความสัมพันธ์บางส่วนนี้คือ 0.623 ซึ่งไม่มีนัยสำคัญทางสถิติที่ α = 0.05

ความสัมพันธ์บางส่วนระหว่างเกรดปัจจุบันและเกรดการสอบปลายภาค:

ความสัมพันธ์บางส่วนระหว่างเกรดปัจจุบันและเกรดการสอบปลายภาคคือ 0.736 ซึ่งแสดงถึงความสัมพันธ์เชิงบวกที่แข็งแกร่ง เมื่อเกรดปัจจุบันเพิ่มขึ้น คะแนนสอบก็มีแนวโน้มเพิ่มขึ้นเช่นกัน โดยสมมติว่าจำนวนชั่วโมงที่เรียนคงที่

ค่า p สำหรับความสัมพันธ์บางส่วนนี้คือ 0.024 ซึ่งมีนัยสำคัญทางสถิติที่ α = 0.05

ความสัมพันธ์บางส่วนระหว่างเกรดปัจจุบันกับชั่วโมงเรียน:

ความสัมพันธ์บางส่วนระหว่างเกรดปัจจุบัน ชั่วโมงเรียน และเกรดการสอบปลายภาคคือ -0.311 ซึ่งแสดงถึงความสัมพันธ์เชิงลบเล็กน้อย เมื่อเกรดปัจจุบันเพิ่มขึ้น เกรดการสอบปลายภาคมีแนวโน้มลดลง โดยถือว่าเกรดการสอบปลายภาคคงที่

ค่า p สำหรับความสัมพันธ์บางส่วนนี้คือ 0.415 ซึ่งไม่มีนัยสำคัญทางสถิติที่ α = 0.05

ผลลัพธ์ยังบอกเราด้วยว่าวิธีที่ใช้ในการคำนวณความสัมพันธ์บางส่วนคือ “เพียร์สัน”

ในฟังก์ชัน pcor() เรายังสามารถระบุ “kendall” หรือ “pearson” เป็นวิธีอื่นในการคำนวณความสัมพันธ์ได้

แหล่งข้อมูลเพิ่มเติม

บทช่วยสอนต่อไปนี้จะอธิบายวิธีดำเนินการงานทั่วไปอื่นๆ ใน R:

วิธีการคำนวณความสัมพันธ์ของอันดับ Spearman ใน R
วิธีการคำนวณความสัมพันธ์ข้ามใน R
วิธีการคำนวณความสัมพันธ์แบบเลื่อนใน R
วิธีการคำนวณความสัมพันธ์แบบพอยต์-ไบซีเรียลใน R

เพิ่มความคิดเห็น

อีเมลของคุณจะไม่แสดงให้คนอื่นเห็น ช่องข้อมูลจำเป็นถูกทำเครื่องหมาย *