วิธีการคำนวณความสัมพันธ์ระหว่างตัวแปรต่อเนื่องและตัวแปรตามหมวดหมู่
เมื่อเราต้องการคำนวณความสัมพันธ์ระหว่างตัวแปรต่อเนื่องสองตัว โดยทั่วไปเราจะใช้ สัมประสิทธิ์สหสัมพันธ์แบบเพียร์สัน
อย่างไรก็ตาม เมื่อเราต้องการคำนวณความสัมพันธ์ระหว่างตัวแปรต่อเนื่องและ ตัวแปรเชิงหมวดหมู่ เราสามารถใช้สิ่งที่เรียกว่าความ สัมพันธ์แบบทวิฐานแบบจุด
ความสัมพันธ์แบบพอยต์ไบซีเรียลใช้ในการคำนวณความสัมพันธ์ระหว่างตัวแปรหมวดหมู่ไบนารี (ตัวแปรที่รับได้เพียงสองค่าเท่านั้น) กับตัวแปรต่อเนื่อง โดยมีคุณสมบัติดังต่อไปนี้
- ความสัมพันธ์แบบพอยต์-ไบซีเรียลอาจแตกต่างกันระหว่าง -1 ถึง 1
- สำหรับแต่ละกลุ่มที่สร้างโดยตัวแปรไบนารี่ จะถือว่าปกติตัวแปรต่อเนื่องจะมีการแจกแจงด้วยความแปรปรวนเท่ากัน
- สำหรับแต่ละกลุ่มที่สร้างขึ้นโดยตัวแปรไบนารี่ จะถือว่าไม่มีค่าผิดปกติที่รุนแรง
ตัวอย่างต่อไปนี้แสดงวิธีคำนวณความสัมพันธ์แบบจุด-ไบซีเรียลในทางปฏิบัติ
ตัวอย่าง: การคำนวณความสัมพันธ์แบบพอยต์-ไบซีเรียล
สมมติว่าอาจารย์มหาวิทยาลัยต้องการตรวจสอบว่ามีความสัมพันธ์ระหว่างเพศและคะแนนในการสอบวัดคุณสมบัติเฉพาะหรือไม่
เขารวบรวมข้อมูลต่อไปนี้เกี่ยวกับเด็กชาย 12 คนและเด็กหญิง 12 คนในชั้นเรียนของเขา:

เนื่องจาก เพศ เป็นตัวแปรเชิงหมวดหมู่และ คะแนน เป็นตัวแปรต่อเนื่อง จึงสมเหตุสมผลที่จะคำนวณความสัมพันธ์แบบจุด-ไบซีเรียลระหว่างตัวแปรทั้งสอง
ศาสตราจารย์สามารถใช้ซอฟต์แวร์ทางสถิติใดก็ได้ (รวมถึง Excel, R, Python, SPSS, Stata) เพื่อคำนวณความสัมพันธ์แบบจุด-ไบซีเรียลระหว่างตัวแปรทั้งสอง
รหัสต่อไปนี้แสดงวิธีคำนวณความสัมพันธ์แบบ point-biserial ใน R โดยใช้ค่า 0 แทนเพศหญิง และ 1 แทนเพศชายสำหรับตัวแปรเพศ:
#define values for gender gender <- c(0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 1, 1, 1, 1, 1, 1, 1, 1, 1, 1, 1, 1) #define values for score score <- c(77, 78, 79, 79, 82, 84, 85, 88, 89, 91, 91, 94, 84, 84, 84, 85, 85, 86, 86, 86, 89, 91, 94, 98) #calculate point-biserial correlation horn. test (gender, score) Pearson's product-moment correlation data: gender and score t = 1.3739, df = 22, p-value = 0.1833 alternative hypothesis: true correlation is not equal to 0 95 percent confidence interval: -0.1379386 0.6147832 sample estimates: horn 0.2810996
จากผลลัพธ์เราจะเห็นว่าค่าสัมประสิทธิ์สหสัมพันธ์แบบจุด-ไบซีเรียลคือ 0.281 และค่า p ที่สอดคล้องกันคือ 0.1833
เนื่องจากค่าสัมประสิทธิ์สหสัมพันธ์เป็นบวก จึงบอกเราว่ามีความสัมพันธ์เชิงบวกระหว่างเพศและคะแนน
เนื่องจากเรากำหนดรหัสเพศชายเป็น 1 และเพศหญิงเป็น 0 สิ่งนี้บ่งชี้ว่าคะแนนมีแนวโน้มที่จะสูงกว่าสำหรับผู้ชาย (กล่าวคือ คะแนนมีแนวโน้มที่จะเพิ่มขึ้นเมื่อเพศ “เพิ่มขึ้น”) » จาก 0 ถึง 1)
อย่างไรก็ตาม เนื่องจากค่า p ไม่น้อยกว่า 0.05 สัมประสิทธิ์สหสัมพันธ์นี้จึงไม่มีนัยสำคัญทางสถิติ
แหล่งข้อมูลเพิ่มเติม
บทช่วยสอนต่อไปนี้จะอธิบายวิธีคำนวณความสัมพันธ์แบบไบซีเรียลแบบจุดโดยใช้ซอฟต์แวร์ทางสถิติต่างๆ
วิธีการคำนวณความสัมพันธ์แบบ point-biserial ใน Excel
วิธีการคำนวณความสัมพันธ์แบบพอยต์-ไบซีเรียลใน R
วิธีการคำนวณความสัมพันธ์แบบ point-biserial ใน Python