การจำกัดขอบเขตคืออะไร?


บ่อยครั้งในสถิติเราพยายามวัด ความสัมพันธ์ ระหว่างตัวแปรสองตัว สิ่งนี้ช่วยให้เราเข้าใจสิ่งต่อไปนี้:

  • ทิศทาง ความสัมพันธ์ระหว่างตัวแปรสองตัว เมื่อตัวแปรตัวหนึ่งเพิ่มขึ้น ตัวแปรอีกตัวมีแนวโน้มเพิ่มขึ้นหรือลดลงหรือไม่?
  • ความเข้มแข็ง ของความสัมพันธ์ระหว่างสองตัวแปร ค่าของตัวแปรทั้งสองจะเปลี่ยนไปเท่าใด?

น่าเสียดายที่ปัญหาที่อาจเกิดขึ้นเมื่อวัดความสัมพันธ์ระหว่างตัวแปรสองตัวเรียกว่า การจำกัดช่วง สิ่งนี้เกิดขึ้นเมื่อ ช่วง ของค่าที่วัดได้สำหรับตัวแปรตัวใดตัวหนึ่งถูกจำกัดด้วยเหตุผลบางประการ

ตัวอย่างเช่น สมมติว่าเราต้องการวัดความสัมพันธ์ระหว่าง ชั่วโมงเรียน กับ คะแนนสอบ ของนักเรียนในโรงเรียนแห่งใดแห่งหนึ่ง

หากเรารวบรวมข้อมูลตัวแปรทั้งสองนี้ให้กับนักเรียนทั้ง 1,000 คนในโรงเรียน เราอาจพบว่าความสัมพันธ์ระหว่าง ชั่วโมงเรียน กับ คะแนนสอบ คือ 0.73

ความสัมพันธ์นี้ค่อนข้างสูง ซึ่งบ่งบอกถึงความสัมพันธ์เชิงบวกที่แข็งแกร่งระหว่างตัวแปรทั้งสอง เมื่อนักเรียนเรียนมากขึ้น พวกเขามักจะทำข้อสอบได้ดีขึ้น

อย่างไรก็ตาม สมมติว่าเรารวบรวมข้อมูลของนักเรียนในหลักสูตรเกียรตินิยมเท่านั้น อาจเป็นไปได้ว่านักเรียนเหล่านี้เรียนมาแล้วอย่างน้อย 6 ชั่วโมง

ดังนั้น หากเราคำนวณความสัมพันธ์ระหว่าง ชั่วโมงเรียน กับ คะแนนสอบ ของนักเรียนเหล่านี้ เราจะใช้ช่วงแคบสำหรับ ชั่วโมงเรียนที่แปรผัน

ตัวอย่างช่วงที่จำกัด

หากเราขยาย Scatterplot ในช่วงที่ ชั่วโมง มากกว่า 6 พล็อตจะมีลักษณะดังนี้:

ตัวอย่าง point cloud สำหรับช่วงที่จำกัด

ความสัมพันธ์ระหว่างตัวแปรทั้งสองบนกราฟนี้กลายเป็น 0.37 ซึ่งต่ำกว่า 0.73 อย่างมีนัยสำคัญ

ดังนั้น หากเรารวบรวมข้อมูลเฉพาะ ชั่วโมงเรียน และ คะแนนสอบ ของนักเรียนในหลักสูตรเกียรตินิยม เราอาจถือว่ามีความสัมพันธ์ที่อ่อนแอระหว่างชั่วโมงเรียนกับคะแนนสอบ

อย่างไรก็ตาม ผลลัพธ์นี้อาจทำให้เข้าใจผิดเนื่องจากเราใช้ ช่วงที่จำกัด สำหรับตัวแปรตัวใดตัวหนึ่ง

ตัวอย่างช่วงที่จำกัดในโลกแห่งความเป็นจริง

ปัญหาของช่วงที่จำกัดสามารถเกิดขึ้นได้ในทางปฏิบัติในการศึกษาวิจัยต่างๆ มากมาย นี่คือตัวอย่างบางส่วน:

1. การศึกษานักกีฬาที่มีสมรรถนะสูง นักวิจัยอาจสนใจที่จะศึกษาว่าโปรแกรมการฝึกบางโปรแกรมสร้างมวลกล้ามเนื้อมากกว่าโปรแกรมมาตรฐานบางโปรแกรมหรือไม่

หากนักวิจัยรวบรวมข้อมูลเฉพาะนักกีฬาชั้นนำ ก็มีแนวโน้มว่านักกีฬาเหล่านี้ล้วนมีมวลกล้ามเนื้อสูงอยู่แล้ว จึงจะมีช่วงค่าที่แคบในการคำนวณความสัมพันธ์ระหว่างโปรแกรมการฝึกกับมวลกล้ามเนื้อที่ผลิตได้

2. การศึกษาของนักเรียนที่มีผลสัมฤทธิ์สูง นักวิจัยอาจต้องการศึกษาว่าโปรแกรมการสอนบางหลักสูตรมีผลดีต่อเกรดหรือไม่ โดยธรรมชาติแล้ว นักเรียนที่กระตือรือร้นที่จะปรับปรุงผลการเรียนของตนเองและเข้าร่วมในโครงการกวดวิชาอาจเป็นนักเรียนที่มีผลการเรียนดีอยู่แล้ว

ดังนั้นคะแนนของนักเรียนเหล่านี้อาจพัฒนาได้ไม่มากนัก เมื่อผู้วิจัยคำนวณความสัมพันธ์ระหว่างชั่วโมงที่ใช้ในโปรแกรมการสอนและผลการเพิ่มเกรด ความสัมพันธ์ที่แท้จริงอาจถูกประเมินต่ำเกินไป เนื่องจากพื้นที่สำหรับการปรับปรุงเกรดถูกจำกัด

วิธีพิจารณาถึงช่วงที่จำกัด

วิธียอดนิยมในการคำนึงถึงช่วงที่จำกัดเรียกว่า Thorndike Case 2 ซึ่งเป็นสูตรที่พัฒนาโดยนักจิตวิทยา Robert L. Thorndike

สูตรนี้ให้ค่าประมาณความสัมพันธ์ที่แท้จริงระหว่างตัวแปรสองตัวและใช้การคำนวณต่อไปนี้:

ความสัมพันธ์ที่แท้จริง = √(1-(SD 2 y จำกัด -SD 2 y ไม่ จำกัด )) * (1-r 2 จำกัด )

ทอง:

  • SD 2 ถูกจำกัด y : ค่าเบี่ยงเบนมาตรฐานกำลังสองของข้อมูลที่มีอยู่ในตัวแปรตอบสนอง y
  • SD 2 ไม่จำกัด : ค่าเบี่ยงเบนมาตรฐานกำลังสองที่ทราบของตัวแปรตอบสนองสำหรับประชากร
  • r 2 ถูกจำกัด : ความสัมพันธ์กำลังสองกับข้อมูลที่ถูกจำกัดที่มีอยู่

สูตรนี้แสดงให้เห็นว่ามีประสิทธิผลในการสร้างค่าประมาณความสัมพันธ์ที่แท้จริงระหว่างตัวแปรสองตัวที่เป็นกลางเมื่อตัวแปรตัวใดตัวหนึ่งทนทุกข์ทรมานจากช่วงที่จำกัด

โปรดทราบว่าในการใช้สูตรนี้ คุณต้องมีค่าประมาณของค่าเบี่ยงเบนมาตรฐานประชากรที่แท้จริงสำหรับตัวแปรตอบสนอง

เพิ่มความคิดเห็น

อีเมลของคุณจะไม่แสดงให้คนอื่นเห็น ช่องข้อมูลจำเป็นถูกทำเครื่องหมาย *