วิธีการทดสอบความสัมพันธ์ใน python (พร้อมตัวอย่าง)


วิธีหนึ่งในการหาปริมาณความสัมพันธ์ระหว่างตัวแปรสองตัวคือการใช้ สัมประสิทธิ์สหสัมพันธ์แบบเพียร์สัน ซึ่งวัดความสัมพันธ์เชิงเส้นระหว่างตัวแปรสอง ตัว

จะใช้ค่าระหว่าง -1 ถึง 1 เสมอโดยที่:

  • -1 บ่งชี้ถึงความสัมพันธ์เชิงเส้นเชิงลบอย่างสมบูรณ์
  • 0 บ่งชี้ว่าไม่มีความสัมพันธ์เชิงเส้น
  • 1 บ่งชี้ถึงความสัมพันธ์เชิงเส้นเชิงบวกอย่างสมบูรณ์

หากต้องการทราบว่าสัมประสิทธิ์สหสัมพันธ์มีนัยสำคัญทางสถิติหรือไม่ คุณสามารถคำนวณคะแนน t และค่า p ที่สอดคล้องกันได้

สูตรคำนวณค่า t-score ของสัมประสิทธิ์สหสัมพันธ์ (r) คือ:

เสื้อ = r * √ n-2 / √ 1-r 2

จากนั้นค่า p จะถูกคำนวณเป็นค่า p แบบสองด้านที่สอดคล้องกันสำหรับการแจกแจงแบบ t โดยมีดีกรีอิสระ n-2

ตัวอย่าง: การทดสอบความสัมพันธ์ใน Python

เพื่อตรวจสอบว่าค่าสัมประสิทธิ์สหสัมพันธ์ระหว่างตัวแปรสองตัวมีนัยสำคัญทางสถิติหรือไม่ คุณสามารถทำการทดสอบสหสัมพันธ์ใน Python โดยใช้ฟังก์ชัน pearsonr จากไลบรารี SciPy

ฟังก์ชันนี้จะคืนค่าสัมประสิทธิ์สหสัมพันธ์ระหว่างตัวแปรสองตัวและค่า p แบบสองด้าน

ตัวอย่างเช่น สมมติว่าเรามีสองตารางต่อไปนี้ใน Python:

 #create two arrays
x = [3, 4, 4, 5, 7, 8, 10, 12, 13, 15]
y = [2, 4, 4, 5, 4, 7, 8, 19, 14, 10]

เราสามารถนำเข้าฟังก์ชัน pearsonr และคำนวณค่าสัมประสิทธิ์สหสัมพันธ์ของ Pearson ระหว่างสองตารางได้:

 from scipy. stats . stats import pearsonr

#calculation correlation coefficient and p-value between x and y
pearsonr(x, y)

(0.8076177030748631, 0.004717255828132089)

ต่อไปนี้เป็นวิธีการตีความผลลัพธ์:

  • ค่าสัมประสิทธิ์สหสัมพันธ์เพียร์สัน (r): 0.8076
  • ค่า p สองด้าน: 0.0047

ค่าสัมประสิทธิ์สหสัมพันธ์อยู่ใกล้กับ 1 ซึ่งบอกเราว่ามีความสัมพันธ์เชิงบวกอย่างมากระหว่างตัวแปรทั้งสอง

และเนื่องจากค่า p ที่สอดคล้องกันน้อยกว่า 0.05 เราจึงสรุปได้ว่ามีความสัมพันธ์ที่มีนัยสำคัญทางสถิติระหว่างตัวแปรทั้งสอง

โปรดทราบว่าเราสามารถแยกค่าสัมประสิทธิ์สหสัมพันธ์และค่า p แต่ละรายการออกจากฟังก์ชัน เพียร์สัน ได้:

 #extract correlation coefficient (rounded to 4 decimal places)
r = round(pearsonr(x, y)[ 0 ], 4)

print (r)

0.8076

#extract p-value (rounded to 4 decimal places) 
p = round(pearsonr(x, y)[ 1 ], 4)

print (p) 

0.0047

ค่าเหล่านี้อ่านง่ายกว่าเล็กน้อยเมื่อเทียบกับเอาต์พุตของฟังก์ชัน pearsonr ดั้งเดิม

แหล่งข้อมูลเพิ่มเติม

บทช่วยสอนต่อไปนี้ให้ข้อมูลเพิ่มเติมเกี่ยวกับค่าสัมประสิทธิ์สหสัมพันธ์:

ความรู้เบื้องต้นเกี่ยวกับสัมประสิทธิ์สหสัมพันธ์เพียร์สัน
อะไรคือความสัมพันธ์ที่ “แข็งแกร่ง”?
สมมติฐานทั้งห้าข้อเกี่ยวกับความสัมพันธ์ของเพียร์สัน

เพิ่มความคิดเห็น

อีเมลของคุณจะไม่แสดงให้คนอื่นเห็น ช่องข้อมูลจำเป็นถูกทำเครื่องหมาย *