วิธีการคำนวณความสัมพันธ์แบบ point-biserial ใน python


ความสัมพันธ์แบบพอยต์-ไบซีเรียล ใช้ในการวัดความสัมพันธ์ระหว่างตัวแปรไบนารี่ x และตัวแปรต่อเนื่อง y

เช่นเดียวกับ ค่าสัมประสิทธิ์สหสัมพันธ์แบบเพียร์สัน ค่าสัมประสิทธิ์สหสัมพันธ์แบบพอยต์-ไบซีเรียลจะใช้ค่าระหว่าง -1 ถึง 1 โดยที่:

  • -1 บ่งชี้ถึงความสัมพันธ์เชิงลบอย่างสมบูรณ์ระหว่างตัวแปรสองตัว
  • 0 บ่งชี้ว่าไม่มีความสัมพันธ์กันระหว่างตัวแปรสองตัว
  • 1 บ่งชี้ถึงความสัมพันธ์เชิงบวกอย่างสมบูรณ์ระหว่างตัวแปรสองตัว

บทช่วยสอนนี้จะอธิบายวิธีคำนวณความสัมพันธ์แบบพอยต์-ไบซีเรียลระหว่างตัวแปรสองตัวใน Python

ตัวอย่าง: ความสัมพันธ์แบบ point-biserial ใน Python

สมมติว่าเรามีตัวแปรไบนารี่ x และตัวแปรต่อเนื่อง y:

 x = [0, 1, 1, 0, 0, 0, 1, 0, 1, 1, 0]
y = [12, 14, 17, 17, 11, 22, 23, 11, 19, 8, 12]

เราสามารถใช้ฟังก์ชัน pointbiserialr() จากไลบรารี scipy.stats เพื่อคำนวณความสัมพันธ์แบบ point-biserial ระหว่างตัวแปรทั้งสอง

โปรดทราบว่าฟังก์ชันนี้จะคืนค่าสัมประสิทธิ์สหสัมพันธ์พร้อมกับค่า p ที่สอดคล้องกัน:

 import scipy.stats as stats

#calculate point-biserial correlation
stats. pointbiserialr (x,y)

PointbiserialrResult(correlation=0.21816, pvalue=0.51928)

ค่าสัมประสิทธิ์สหสัมพันธ์แบบจุด-ไบซีเรียลคือ 0.21816 และค่า p ที่สอดคล้องกันคือ 0.51928

เนื่องจากค่าสัมประสิทธิ์สหสัมพันธ์เป็นบวก แสดงว่าเมื่อตัวแปร x รับค่า “1” ตัวแปร y มีแนวโน้มที่จะรับค่าที่สูงกว่าเมื่อตัวแปร x รับค่า “0”

เนื่องจากค่า p ของความสัมพันธ์นี้ไม่น้อยกว่า 0.05 ความสัมพันธ์นี้จึงไม่มีนัยสำคัญทางสถิติ

คุณสามารถดูรายละเอียดที่แน่นอนเกี่ยวกับวิธีการคำนวณความสัมพันธ์นี้ได้ใน เอกสารประกอบ scipy.stats

เพิ่มความคิดเห็น

อีเมลของคุณจะไม่แสดงให้คนอื่นเห็น ช่องข้อมูลจำเป็นถูกทำเครื่องหมาย *