5 ตัวอย่างความสัมพันธ์ที่ผิดพลาดในชีวิตจริง
ในสถิติ ความสัมพันธ์ปลอม หมายถึงความสัมพันธ์ระหว่างตัวแปรสองตัวที่เกิดขึ้นโดยบังเอิญล้วนๆ โดยไม่มีตัวแปรตัวใดตัวหนึ่งทำให้เกิดอีกตัวแปรหนึ่งจริงๆ
ความสัมพันธ์ประเภทนี้เป็นอันตรายเพราะบางครั้งอาจบอกได้ว่าตัวแปรตัวหนึ่งทำให้เกิดอีกตัวแปรหนึ่ง เมื่อในความเป็นจริงแล้วความสัมพันธ์นั้นเกิดขึ้นโดยบังเอิญล้วนๆ
ปรากฎว่าความสัมพันธ์ประเภทนี้ระหว่างตัวแปรเกิดขึ้นตลอดเวลาในชีวิตจริง
ตัวอย่างต่อไปนี้แบ่งปันตัวอย่างความสัมพันธ์ที่ผิดพลาดในโลกแห่งความเป็นจริงห้าตัวอย่าง
ตัวอย่างที่ 1: ความเชี่ยวชาญและรายได้จากบ็อกซ์ออฟฟิศ
หากเรารวบรวมข้อมูลเกี่ยวกับจำนวนปริญญาโททั้งหมดที่มหาวิทยาลัยมอบให้ในแต่ละปี และรายได้รวมในบ็อกซ์ออฟฟิศที่เกิดขึ้นต่อปี เราจะพบว่าตัวแปรทั้งสองมีความสัมพันธ์กันสูง

นี่ไม่ได้หมายความว่าการออกปริญญาโทเพิ่มส่งผลให้รายรับในบ็อกซ์ออฟฟิศเพิ่มขึ้นในแต่ละปี
คำอธิบายที่เป็นไปได้มากที่สุดก็คือ ประชากรโลกเพิ่มขึ้นทุกปี ซึ่งหมายความว่าในแต่ละปีจะมีการมอบปริญญาโทมากขึ้น และจำนวนผู้ที่ไปชมภาพยนตร์ในแต่ละปีก็เพิ่มขึ้นในสัดส่วนที่เท่ากันโดยประมาณ
ความสัมพันธ์ระหว่างตัวแปรทั้งสองนั้นเป็นของปลอม
ตัวอย่างที่ 2: กรณีโรคหัดที่เกี่ยวข้องกับอัตราการแต่งงาน
หากเรารวบรวมข้อมูลในแต่ละปีเกี่ยวกับจำนวนผู้ป่วยโรคหัดทั้งหมดในสหรัฐอเมริกาและอัตราการแต่งงาน เราจะพบว่าตัวแปรทั้งสองมีความสัมพันธ์กันสูง

นี่ไม่ได้หมายความว่าการลดจำนวนผู้ป่วยโรคหัดจะส่งผลให้อัตราการแต่งงานลดลง ตัวแปรทั้งสองมีความเป็นอิสระ
การแพทย์สมัยใหม่เพียงแต่ทำให้ผู้ป่วยโรคหัดลดลงและมีผู้ที่แต่งงานกันน้อยลงในแต่ละปีด้วยเหตุผลหลายประการ
ความสัมพันธ์ระหว่างตัวแปรทั้งสองนั้นเป็นของปลอม
ตัวอย่างที่ 3: ผู้สำเร็จการศึกษาระดับมัธยมปลายที่เกี่ยวข้องกับการบริโภคโดนัท
หากเรารวบรวมข้อมูลในแต่ละปีเกี่ยวกับจำนวนผู้สำเร็จการศึกษาระดับมัธยมศึกษาตอนปลายและการบริโภคโดนัททั้งหมดในสหรัฐอเมริกา เราจะพบว่าตัวแปรทั้งสองมีความสัมพันธ์กันสูง

นี่ไม่ได้หมายความว่าการเพิ่มจำนวนผู้สำเร็จการศึกษาระดับมัธยมศึกษาตอนปลายทำให้การบริโภคโดนัทเพิ่มขึ้นในสหรัฐอเมริกา
คำอธิบายที่เป็นไปได้มากที่สุดก็คือ ประชากรสหรัฐฯ เพิ่มขึ้นเมื่อเวลาผ่านไป ซึ่งหมายความว่าจำนวนผู้ที่มีประกาศนียบัตรมัธยมปลายและจำนวนโดนัททั้งหมดที่บริโภคเพิ่มขึ้นเมื่อจำนวนประชากรเพิ่มขึ้น
นี่เป็นความสัมพันธ์ที่ผิดพลาด
ตัวอย่างที่ 4: การขายวิดีโอเกมเทียบกับการผลิตพลังงานนิวเคลียร์
หากเรารวบรวมข้อมูลยอดขายรวมของวิดีโอเกมในแต่ละปีทั่วโลกและพลังงานทั้งหมดที่ผลิตโดยโรงไฟฟ้านิวเคลียร์ เราจะพบว่าตัวแปรทั้งสองมีความสัมพันธ์กันสูง

นี่ไม่ได้หมายความว่ายอดขายวิดีโอเกมที่เพิ่มขึ้นจะนำไปสู่การผลิตพลังงานนิวเคลียร์ที่เพิ่มขึ้น
ในทางกลับกัน มีการสร้างโรงไฟฟ้านิวเคลียร์มากขึ้นและจำหน่ายวิดีโอเกมมากขึ้นเมื่อจำนวนประชากรโลกเพิ่มขึ้นในแต่ละปี
แม้ว่าตัวแปรทั้งสองจะเพิ่มขึ้นอย่างต่อเนื่องเมื่อเวลาผ่านไป ตัวแปรหนึ่งไม่ได้เป็นสาเหตุของอีกตัวแปรหนึ่ง ความสัมพันธ์ระหว่างคนทั้งสองนั้นเป็นของปลอม
ตัวอย่างที่ 5: รายได้ของ Arcades เทียบกับ งานเหมืองถ่านหิน
หากเรารวบรวมข้อมูลรายได้ทั้งหมดที่เกิดจากร้านค้าในสหรัฐอเมริกาและจำนวนงานเหมืองถ่านหินทั้งหมดในสหรัฐอเมริกา เราจะพบว่าตัวแปรทั้งสองมีความสัมพันธ์กันสูง

นี่ไม่ได้หมายความว่าตัวแปรตัวหนึ่งจะทำให้อีกตัวแปรหนึ่งลดลง
แต่ร้านค้าและเหมืองถ่านหินกลับกลายเป็นเรื่องธรรมดาน้อยลงในช่วงหลายปีที่ผ่านมา ซึ่งอธิบายว่าทำไมตัวแปรทั้งสองจึงลดลงในอัตราที่ใกล้เคียงกัน
ความสัมพันธ์ระหว่างตัวแปรทั้งสองนั้นเป็นของปลอม
แหล่งข้อมูลเพิ่มเติม
บทช่วยสอนต่อไปนี้เป็นตัวอย่างของแนวคิดทางสถิติอื่นๆ ในโลกแห่งความเป็นจริง:
ตัวอย่างการใช้ความน่าจะเป็นในชีวิตจริง
ตัวอย่างการใช้ความสัมพันธ์ในชีวิตจริง
ตัวอย่างการใช้ค่าเฉลี่ย ค่ามัธยฐาน และโหมดในชีวิตจริง