สิ่งที่เรียกว่า "อ่อนแอ"; ความสัมพันธ์?


ในทางสถิติ เรามักจะพยายามทำความเข้าใจว่าตัวแปรสองตัวมีความสัมพันธ์กันอย่างไร ตัวอย่างเช่น เราอาจต้องการทราบ:

  • อะไรคือความสัมพันธ์ระหว่างจำนวนชั่วโมงที่นักเรียนเรียนกับเกรดที่พวกเขาได้รับจากการสอบ?
  • ความสัมพันธ์ระหว่างอุณหภูมิภายนอกกับจำนวนแท่งไอศกรีมที่ขายโดยรถขายอาหารคืออะไร
  • ความสัมพันธ์ระหว่างเงินที่ใช้ไปกับการโฆษณากับรายได้รวมที่ได้รับจากธุรกิจหนึ่งๆ คืออะไร

ในแต่ละสถานการณ์ เราต้องการทำความเข้าใจความสัมพันธ์ระหว่างตัวแปรสองตัว

วิธีหนึ่งที่พบบ่อยที่สุดในการหาปริมาณความสัมพันธ์ระหว่างตัวแปรสองตัวคือการใช้ สัมประสิทธิ์สหสัมพันธ์แบบเพียร์สัน ซึ่งเป็นหน่วยวัดความสัมพันธ์เชิงเส้นระหว่างตัวแปรสองตัว

จะใช้ค่าระหว่าง -1 ถึง 1 เสมอโดยที่:

  • -1 บ่งชี้ถึงความสัมพันธ์เชิงเส้นเชิงลบอย่างสมบูรณ์ระหว่างตัวแปรสองตัว
  • 0 บ่งชี้ว่าไม่มีความสัมพันธ์เชิงเส้นระหว่างตัวแปรสองตัว
  • 1 บ่งชี้ความสัมพันธ์เชิงเส้นเชิงบวกอย่างสมบูรณ์ระหว่างตัวแปรสองตัว

มักเขียนแทนด้วย r ตัวเลขนี้ช่วยให้เราเข้าใจถึงความเข้มแข็งของความสัมพันธ์ระหว่างตัวแปรสองตัว ยิ่ง r ใกล้ศูนย์ ความสัมพันธ์ระหว่างตัวแปรทั้งสองก็จะยิ่งอ่อนลง

สิ่งสำคัญคือต้องทราบว่าตัวแปรสองตัวสามารถมีความสัมพันธ์ เชิงบวก ที่อ่อนแอหรือความสัมพันธ์ เชิงลบ ที่อ่อนแอได้

ความสัมพันธ์เชิงบวกที่อ่อนแอ: เมื่อตัวแปรตัวหนึ่งเพิ่มขึ้น ตัวแปรอีกตัวก็มีแนวโน้มที่จะเพิ่มขึ้นเช่นกัน แต่จะเพียงเล็กน้อยหรือไม่น่าเชื่อถือเท่านั้น

ตัวอย่างของความสัมพันธ์เชิงบวกที่อ่อนแอ

ความสัมพันธ์เชิงลบต่ำ: เมื่อตัวแปรตัวหนึ่งเพิ่มขึ้น ตัวแปรอีกตัวมีแนวโน้มที่จะลดลง แต่จะเพียงเล็กน้อยหรือไม่น่าเชื่อถือเท่านั้น

ตัวอย่างของความสัมพันธ์เชิงลบที่อ่อนแอ

ตารางต่อไปนี้แสดงกฎทั่วไปสำหรับการตีความจุดแข็งของความสัมพันธ์ระหว่างตัวแปรสองตัวตามค่าของ r :

ค่าสัมบูรณ์ของ r ความแข็งแกร่งของความสัมพันธ์
อาร์ < 0.25 ไม่มีความสัมพันธ์
0.25 < ร < 0.5 ความสัมพันธ์ที่อ่อนแอ
0.5 < ร < 0.75 ความสัมพันธ์ระดับปานกลาง
ร > 0.75 ความสัมพันธ์ที่แข็งแกร่ง

ความสัมพันธ์ระหว่างตัวแปรสองตัวถือว่าต่ำหากค่าสัมบูรณ์ของ r อยู่ระหว่าง 0.25 ถึง 0.5

อย่างไรก็ตาม คำจำกัดความของความสัมพันธ์แบบ “อ่อนแอ” อาจแตกต่างกันไปในแต่ละฟิลด์

ทางการแพทย์

ในวงการแพทย์ คำจำกัดความของความสัมพันธ์แบบ “อ่อนแอ” มักจะต่ำกว่ามาก หากความสัมพันธ์ระหว่างการกินยาบางชนิดกับการลดภาวะหัวใจวายคือ r = 0.2 ก็อาจถือว่า “ไม่มีความสัมพันธ์” ในด้านอื่น ๆ แต่ในทางการแพทย์ก็มีความสำคัญเพียงพอว่า ควรรับประทานยาเพื่อลดความเสี่ยงต่อการเกิดภาวะหัวใจวาย . มีอาการหัวใจวาย

ทรัพยากรมนุษย์

ในสาขาเช่นทรัพยากรมนุษย์ ความสัมพันธ์ที่ต่ำกว่าก็ถูกใช้บ่อยกว่าเช่นกัน ตัวอย่างเช่น ความสัมพันธ์ระหว่างเกรดเฉลี่ยของวิทยาลัยกับผลการปฏิบัติงานมีค่าประมาณ r = 0.16 นั่นค่อนข้างน้อย แต่สำคัญเพียงพอที่บริษัทควรพิจารณาในระหว่างขั้นตอนการสัมภาษณ์เป็นอย่างน้อย

เทคโนโลยี

ในสาขาเทคโนโลยี ความสัมพันธ์ระหว่างตัวแปรอาจต้องสูงกว่ามากจึงจะถือว่า “ต่ำ” ตัวอย่างเช่น หากบริษัทสร้างรถยนต์ไร้คนขับและความสัมพันธ์ระหว่างการตัดสินใจเลี้ยวของรถกับความน่าจะเป็นในการหลีกเลี่ยงอุบัติเหตุคือ r = 0.95 นี่ถือได้ว่าเป็นความสัมพันธ์ที่ “อ่อนแอ” และอาจอ่อนแอเกินไปสำหรับรถที่จะ ถือว่าปลอดภัยเพราะการตัดสินใจผิดอาจถึงแก่ชีวิตได้

ใช้ Scatterplots เพื่อแสดงภาพความสัมพันธ์

เมื่อคำนวณค่าสัมประสิทธิ์สหสัมพันธ์ระหว่างตัวแปรสองตัว จะมีประโยชน์ในการสร้างแผนภาพกระจายเพื่อให้เห็นภาพความสัมพันธ์เช่นกัน

โดยเฉพาะอย่างยิ่ง point cloud มีข้อดีสองประการ:

1. Scatterplots สามารถช่วยคุณระบุค่าผิดปกติที่ส่งผลต่อค่าสัมประสิทธิ์สหสัมพันธ์ได้

ค่าผิดปกติที่รุนแรงอาจส่งผลกระทบอย่างมากต่อค่าสัมประสิทธิ์สหสัมพันธ์ ลองพิจารณาตัวอย่างด้านล่าง ซึ่งตัวแปร X และ Y มีค่าสัมประสิทธิ์สหสัมพันธ์แบบเพียร์สันเป็น r = 0.91

ตอนนี้ลองจินตนาการว่าเราเปลี่ยนจุดข้อมูลแรกให้ใหญ่ขึ้นมาก ค่าสัมประสิทธิ์สหสัมพันธ์กลายเป็น r = 0.29 ทันที

จุดข้อมูลเดียวนี้จะเปลี่ยนค่าสัมประสิทธิ์สหสัมพันธ์จากความสัมพันธ์เชิงบวกอย่างมากไปเป็นความสัมพันธ์เชิงบวกเล็กน้อย

(2) Scatterplots สามารถช่วยคุณระบุความสัมพันธ์แบบไม่เชิงเส้นระหว่างตัวแปรได้

ค่าสัมประสิทธิ์สหสัมพันธ์แบบเพียร์สันเพียงบอกเราว่าตัวแปรสองตัวมีความสัมพันธ์ เชิงเส้นตรง หรือไม่ แต่ถึงแม้ว่าค่าสัมประสิทธิ์สหสัมพันธ์แบบเพียร์สันจะบอกเราว่าตัวแปรสองตัวนั้นไม่มีความสัมพันธ์กัน พวกมันก็ยังสามารถมีความสัมพันธ์แบบไม่เชิงเส้นได้

ตัวอย่างเช่น พิจารณาแผนภาพกระจายด้านล่างระหว่างตัวแปร X และ Y ซึ่งมีความสัมพันธ์กันคือ r = 0.00

เห็นได้ชัดว่าตัวแปรไม่มีความสัมพันธ์เชิงเส้น แต่ มี ความสัมพันธ์แบบไม่เชิงเส้น ค่า y เป็นเพียงค่า x กำลังสอง

ค่าสัมประสิทธิ์สหสัมพันธ์เพียงอย่างเดียวไม่สามารถตรวจพบความสัมพันธ์นี้ได้ แต่แผนภาพกระจายสามารถทำได้

บทสรุป

สรุป:

1. โดยทั่วไป ค่าสัมประสิทธิ์สหสัมพันธ์ระหว่าง 0.25 ถึง 0.5 ถือเป็นความสัมพันธ์ที่ “อ่อนแอ” ระหว่างตัวแปรสองตัว

2. หลักการทั่วไปนี้อาจแตกต่างกันไปในแต่ละพื้นที่ ตัวอย่างเช่น ความสัมพันธ์ที่ต่ำกว่ามากอาจถือว่าอ่อนแอในสาขาการแพทย์เมื่อเปรียบเทียบกับสาขาเทคโนโลยี อย่าลืมใช้ความเชี่ยวชาญในเนื้อหาของคุณเพื่อตัดสินใจว่าสิ่งใดที่ถือว่ามีความสัมพันธ์ต่ำ

3. เมื่อใช้สัมประสิทธิ์สหสัมพันธ์เพื่ออธิบายความสัมพันธ์ระหว่างตัวแปรสองตัว การสร้างแผนภูมิกระจายเพื่อให้คุณสามารถระบุค่าผิดปกติในชุดข้อมูลตลอดจนความสัมพันธ์ที่ไม่เชิงเส้นที่อาจเกิดขึ้นได้

แหล่งข้อมูลเพิ่มเติม

อะไรคือความสัมพันธ์ที่ “แข็งแกร่ง”?
เครื่องคำนวณเมทริกซ์สหสัมพันธ์
ความสัมพันธ์เทียบกับ สมาคม: อะไรคือความแตกต่าง?

เพิ่มความคิดเห็น

อีเมลของคุณจะไม่แสดงให้คนอื่นเห็น ช่องข้อมูลจำเป็นถูกทำเครื่องหมาย *