สิ่งที่เรียกว่า "อ่อนแอ"; ความสัมพันธ์?
ในทางสถิติ เรามักจะพยายามทำความเข้าใจว่าตัวแปรสองตัวมีความสัมพันธ์กันอย่างไร ตัวอย่างเช่น เราอาจต้องการทราบ:
- อะไรคือความสัมพันธ์ระหว่างจำนวนชั่วโมงที่นักเรียนเรียนกับเกรดที่พวกเขาได้รับจากการสอบ?
- ความสัมพันธ์ระหว่างอุณหภูมิภายนอกกับจำนวนแท่งไอศกรีมที่ขายโดยรถขายอาหารคืออะไร
- ความสัมพันธ์ระหว่างเงินที่ใช้ไปกับการโฆษณากับรายได้รวมที่ได้รับจากธุรกิจหนึ่งๆ คืออะไร
ในแต่ละสถานการณ์ เราต้องการทำความเข้าใจความสัมพันธ์ระหว่างตัวแปรสองตัว
วิธีหนึ่งที่พบบ่อยที่สุดในการหาปริมาณความสัมพันธ์ระหว่างตัวแปรสองตัวคือการใช้ สัมประสิทธิ์สหสัมพันธ์แบบเพียร์สัน ซึ่งเป็นหน่วยวัดความสัมพันธ์เชิงเส้นระหว่างตัวแปรสองตัว
จะใช้ค่าระหว่าง -1 ถึง 1 เสมอโดยที่:
- -1 บ่งชี้ถึงความสัมพันธ์เชิงเส้นเชิงลบอย่างสมบูรณ์ระหว่างตัวแปรสองตัว
- 0 บ่งชี้ว่าไม่มีความสัมพันธ์เชิงเส้นระหว่างตัวแปรสองตัว
- 1 บ่งชี้ความสัมพันธ์เชิงเส้นเชิงบวกอย่างสมบูรณ์ระหว่างตัวแปรสองตัว
มักเขียนแทนด้วย r ตัวเลขนี้ช่วยให้เราเข้าใจถึงความเข้มแข็งของความสัมพันธ์ระหว่างตัวแปรสองตัว ยิ่ง r ใกล้ศูนย์ ความสัมพันธ์ระหว่างตัวแปรทั้งสองก็จะยิ่งอ่อนลง
สิ่งสำคัญคือต้องทราบว่าตัวแปรสองตัวสามารถมีความสัมพันธ์ เชิงบวก ที่อ่อนแอหรือความสัมพันธ์ เชิงลบ ที่อ่อนแอได้
ความสัมพันธ์เชิงบวกที่อ่อนแอ: เมื่อตัวแปรตัวหนึ่งเพิ่มขึ้น ตัวแปรอีกตัวก็มีแนวโน้มที่จะเพิ่มขึ้นเช่นกัน แต่จะเพียงเล็กน้อยหรือไม่น่าเชื่อถือเท่านั้น

ความสัมพันธ์เชิงลบต่ำ: เมื่อตัวแปรตัวหนึ่งเพิ่มขึ้น ตัวแปรอีกตัวมีแนวโน้มที่จะลดลง แต่จะเพียงเล็กน้อยหรือไม่น่าเชื่อถือเท่านั้น

ตารางต่อไปนี้แสดงกฎทั่วไปสำหรับการตีความจุดแข็งของความสัมพันธ์ระหว่างตัวแปรสองตัวตามค่าของ r :
| ค่าสัมบูรณ์ของ r | ความแข็งแกร่งของความสัมพันธ์ |
|---|---|
| อาร์ < 0.25 | ไม่มีความสัมพันธ์ |
| 0.25 < ร < 0.5 | ความสัมพันธ์ที่อ่อนแอ |
| 0.5 < ร < 0.75 | ความสัมพันธ์ระดับปานกลาง |
| ร > 0.75 | ความสัมพันธ์ที่แข็งแกร่ง |
ความสัมพันธ์ระหว่างตัวแปรสองตัวถือว่าต่ำหากค่าสัมบูรณ์ของ r อยู่ระหว่าง 0.25 ถึง 0.5
อย่างไรก็ตาม คำจำกัดความของความสัมพันธ์แบบ “อ่อนแอ” อาจแตกต่างกันไปในแต่ละฟิลด์
ทางการแพทย์
ในวงการแพทย์ คำจำกัดความของความสัมพันธ์แบบ “อ่อนแอ” มักจะต่ำกว่ามาก หากความสัมพันธ์ระหว่างการกินยาบางชนิดกับการลดภาวะหัวใจวายคือ r = 0.2 ก็อาจถือว่า “ไม่มีความสัมพันธ์” ในด้านอื่น ๆ แต่ในทางการแพทย์ก็มีความสำคัญเพียงพอว่า ควรรับประทานยาเพื่อลดความเสี่ยงต่อการเกิดภาวะหัวใจวาย . มีอาการหัวใจวาย
ทรัพยากรมนุษย์
ในสาขาเช่นทรัพยากรมนุษย์ ความสัมพันธ์ที่ต่ำกว่าก็ถูกใช้บ่อยกว่าเช่นกัน ตัวอย่างเช่น ความสัมพันธ์ระหว่างเกรดเฉลี่ยของวิทยาลัยกับผลการปฏิบัติงานมีค่าประมาณ r = 0.16 นั่นค่อนข้างน้อย แต่สำคัญเพียงพอที่บริษัทควรพิจารณาในระหว่างขั้นตอนการสัมภาษณ์เป็นอย่างน้อย
เทคโนโลยี
ในสาขาเทคโนโลยี ความสัมพันธ์ระหว่างตัวแปรอาจต้องสูงกว่ามากจึงจะถือว่า “ต่ำ” ตัวอย่างเช่น หากบริษัทสร้างรถยนต์ไร้คนขับและความสัมพันธ์ระหว่างการตัดสินใจเลี้ยวของรถกับความน่าจะเป็นในการหลีกเลี่ยงอุบัติเหตุคือ r = 0.95 นี่ถือได้ว่าเป็นความสัมพันธ์ที่ “อ่อนแอ” และอาจอ่อนแอเกินไปสำหรับรถที่จะ ถือว่าปลอดภัยเพราะการตัดสินใจผิดอาจถึงแก่ชีวิตได้
ใช้ Scatterplots เพื่อแสดงภาพความสัมพันธ์
เมื่อคำนวณค่าสัมประสิทธิ์สหสัมพันธ์ระหว่างตัวแปรสองตัว จะมีประโยชน์ในการสร้างแผนภาพกระจายเพื่อให้เห็นภาพความสัมพันธ์เช่นกัน
โดยเฉพาะอย่างยิ่ง point cloud มีข้อดีสองประการ:
1. Scatterplots สามารถช่วยคุณระบุค่าผิดปกติที่ส่งผลต่อค่าสัมประสิทธิ์สหสัมพันธ์ได้
ค่าผิดปกติที่รุนแรงอาจส่งผลกระทบอย่างมากต่อค่าสัมประสิทธิ์สหสัมพันธ์ ลองพิจารณาตัวอย่างด้านล่าง ซึ่งตัวแปร X และ Y มีค่าสัมประสิทธิ์สหสัมพันธ์แบบเพียร์สันเป็น r = 0.91

ตอนนี้ลองจินตนาการว่าเราเปลี่ยนจุดข้อมูลแรกให้ใหญ่ขึ้นมาก ค่าสัมประสิทธิ์สหสัมพันธ์กลายเป็น r = 0.29 ทันที

จุดข้อมูลเดียวนี้จะเปลี่ยนค่าสัมประสิทธิ์สหสัมพันธ์จากความสัมพันธ์เชิงบวกอย่างมากไปเป็นความสัมพันธ์เชิงบวกเล็กน้อย
(2) Scatterplots สามารถช่วยคุณระบุความสัมพันธ์แบบไม่เชิงเส้นระหว่างตัวแปรได้
ค่าสัมประสิทธิ์สหสัมพันธ์แบบเพียร์สันเพียงบอกเราว่าตัวแปรสองตัวมีความสัมพันธ์ เชิงเส้นตรง หรือไม่ แต่ถึงแม้ว่าค่าสัมประสิทธิ์สหสัมพันธ์แบบเพียร์สันจะบอกเราว่าตัวแปรสองตัวนั้นไม่มีความสัมพันธ์กัน พวกมันก็ยังสามารถมีความสัมพันธ์แบบไม่เชิงเส้นได้
ตัวอย่างเช่น พิจารณาแผนภาพกระจายด้านล่างระหว่างตัวแปร X และ Y ซึ่งมีความสัมพันธ์กันคือ r = 0.00

เห็นได้ชัดว่าตัวแปรไม่มีความสัมพันธ์เชิงเส้น แต่ มี ความสัมพันธ์แบบไม่เชิงเส้น ค่า y เป็นเพียงค่า x กำลังสอง
ค่าสัมประสิทธิ์สหสัมพันธ์เพียงอย่างเดียวไม่สามารถตรวจพบความสัมพันธ์นี้ได้ แต่แผนภาพกระจายสามารถทำได้
บทสรุป
สรุป:
1. โดยทั่วไป ค่าสัมประสิทธิ์สหสัมพันธ์ระหว่าง 0.25 ถึง 0.5 ถือเป็นความสัมพันธ์ที่ “อ่อนแอ” ระหว่างตัวแปรสองตัว
2. หลักการทั่วไปนี้อาจแตกต่างกันไปในแต่ละพื้นที่ ตัวอย่างเช่น ความสัมพันธ์ที่ต่ำกว่ามากอาจถือว่าอ่อนแอในสาขาการแพทย์เมื่อเปรียบเทียบกับสาขาเทคโนโลยี อย่าลืมใช้ความเชี่ยวชาญในเนื้อหาของคุณเพื่อตัดสินใจว่าสิ่งใดที่ถือว่ามีความสัมพันธ์ต่ำ
3. เมื่อใช้สัมประสิทธิ์สหสัมพันธ์เพื่ออธิบายความสัมพันธ์ระหว่างตัวแปรสองตัว การสร้างแผนภูมิกระจายเพื่อให้คุณสามารถระบุค่าผิดปกติในชุดข้อมูลตลอดจนความสัมพันธ์ที่ไม่เชิงเส้นที่อาจเกิดขึ้นได้
แหล่งข้อมูลเพิ่มเติม
อะไรคือความสัมพันธ์ที่ “แข็งแกร่ง”?
เครื่องคำนวณเมทริกซ์สหสัมพันธ์
ความสัมพันธ์เทียบกับ สมาคม: อะไรคือความแตกต่าง?