วิธีการคำนวณความสัมพันธ์แบบ point-biserial ใน python
ความสัมพันธ์แบบพอยต์-ไบซีเรียล ใช้ในการวัดความสัมพันธ์ระหว่างตัวแปรไบนารี่ x และตัวแปรต่อเนื่อง y
เช่นเดียวกับ ค่าสัมประสิทธิ์สหสัมพันธ์แบบเพียร์สัน ค่าสัมประสิทธิ์สหสัมพันธ์แบบพอยต์-ไบซีเรียลจะใช้ค่าระหว่าง -1 ถึง 1 โดยที่:
- -1 บ่งชี้ถึงความสัมพันธ์เชิงลบอย่างสมบูรณ์ระหว่างตัวแปรสองตัว
- 0 บ่งชี้ว่าไม่มีความสัมพันธ์กันระหว่างตัวแปรสองตัว
- 1 บ่งชี้ถึงความสัมพันธ์เชิงบวกอย่างสมบูรณ์ระหว่างตัวแปรสองตัว
บทช่วยสอนนี้จะอธิบายวิธีคำนวณความสัมพันธ์แบบพอยต์-ไบซีเรียลระหว่างตัวแปรสองตัวใน Python
ตัวอย่าง: ความสัมพันธ์แบบ point-biserial ใน Python
สมมติว่าเรามีตัวแปรไบนารี่ x และตัวแปรต่อเนื่อง y:
x = [0, 1, 1, 0, 0, 0, 1, 0, 1, 1, 0] y = [12, 14, 17, 17, 11, 22, 23, 11, 19, 8, 12]
เราสามารถใช้ฟังก์ชัน pointbiserialr() จากไลบรารี scipy.stats เพื่อคำนวณความสัมพันธ์แบบ point-biserial ระหว่างตัวแปรทั้งสอง
โปรดทราบว่าฟังก์ชันนี้จะคืนค่าสัมประสิทธิ์สหสัมพันธ์พร้อมกับค่า p ที่สอดคล้องกัน:
import scipy.stats as stats #calculate point-biserial correlation stats. pointbiserialr (x,y) PointbiserialrResult(correlation=0.21816, pvalue=0.51928)
ค่าสัมประสิทธิ์สหสัมพันธ์แบบจุด-ไบซีเรียลคือ 0.21816 และค่า p ที่สอดคล้องกันคือ 0.51928
เนื่องจากค่าสัมประสิทธิ์สหสัมพันธ์เป็นบวก แสดงว่าเมื่อตัวแปร x รับค่า “1” ตัวแปร y มีแนวโน้มที่จะรับค่าที่สูงกว่าเมื่อตัวแปร x รับค่า “0”
เนื่องจากค่า p ของความสัมพันธ์นี้ไม่น้อยกว่า 0.05 ความสัมพันธ์นี้จึงไม่มีนัยสำคัญทางสถิติ
คุณสามารถดูรายละเอียดที่แน่นอนเกี่ยวกับวิธีการคำนวณความสัมพันธ์นี้ได้ใน เอกสารประกอบ scipy.stats