R หลายหรือ r square: อะไรคือความแตกต่าง?
เมื่อคุณปรับ โมเดลการถดถอย โดยใช้ซอฟต์แวร์ทางสถิติส่วนใหญ่ คุณจะสังเกตเห็นค่าสองค่าต่อไปนี้ในผลลัพธ์:
หลายค่า R: ค่าสัมประสิทธิ์สหสัมพันธ์พหุคูณระหว่างตัวแปรตั้งแต่ 3 ตัวขึ้นไป
R-Square: ค่านี้คำนวณเป็น (หลาย R) 2 และแสดงถึงสัดส่วนของความแปรปรวนใน ตัวแปรตอบ สนองของแบบจำลองการถดถอยที่สามารถอธิบายได้ด้วยตัวแปรทำนาย ค่านี้จะแตกต่างกันไปตั้งแต่ 0 ถึง 1
ในทางปฏิบัติ เรามักจะสนใจค่า R-squared เพราะมันบอกเราว่าตัวแปรทำนายมีประโยชน์อย่างไรในการทำนายค่าของตัวแปรตอบสนอง
อย่างไรก็ตาม ทุกครั้งที่เราเพิ่มตัวแปรทำนายใหม่ให้กับโมเดล ค่า R-squared จะรับประกันว่าจะเพิ่มขึ้น แม้ว่าตัวแปรทำนายจะไม่มีประโยชน์ก็ตาม
R-squared ที่ปรับปรุงแล้ว คือ R-squared เวอร์ชันแก้ไขที่ปรับตามจำนวนตัวทำนายในแบบจำลองการถดถอย มีการคำนวณดังนี้:
ปรับแล้ว R 2 = 1 – [(1-R 2 )*(n-1)/(nk-1)]
ทอง:
- R 2 : R 2 ของรุ่น
- n : จำนวนการสังเกต
- k : จำนวนตัวแปรทำนาย
เนื่องจาก R-squared จะเพิ่มขึ้นเสมอเมื่อคุณเพิ่มตัวทำนายให้กับโมเดล R-squared ที่ปรับแล้วจึงสามารถใช้เป็นหน่วยเมตริกที่บอกคุณว่าแบบจำลองมีประโยชน์อย่างไร โดยปรับตามจำนวนตัวทำนายในแบบจำลอง
เพื่อให้เข้าใจคำศัพท์เหล่านี้แต่ละคำได้ดีขึ้น โปรดพิจารณาตัวอย่างต่อไปนี้
ตัวอย่าง: หลายค่า R, R-squared และ R-squared ที่ปรับแล้ว
สมมติว่าเรามีชุดข้อมูลต่อไปนี้ซึ่งมีตัวแปร 3 ตัวต่อไปนี้สำหรับนักเรียน 12 คนที่แตกต่างกัน:
สมมติว่าเราปรับแบบจำลองการถดถอยเชิงเส้นพหุคูณโดยใช้ ชั่วโมงการศึกษา และ เกรดปัจจุบัน เป็นตัวแปรทำนายและ คะแนนการสอบ เป็นตัวแปรตอบสนอง และรับผลลัพธ์ต่อไปนี้:
เราสามารถสังเกตค่าของสามตัวชี้วัดต่อไปนี้:
หลายค่า R: 0.978 นี่แสดงถึงความสัมพันธ์พหุคูณระหว่างตัวแปรตอบสนองและตัวแปรทำนายทั้งสอง
อาร์ สแควร์: 0.956 . ซึ่งคำนวณเป็น (หลาย R) 2 = (0.978) 2 = 0.956 ข้อมูลนี้บอกเราว่า 95.6% ของการเปลี่ยนแปลงของคะแนนสอบสามารถอธิบายได้ด้วยจำนวนชั่วโมงที่นักเรียนใช้เวลาเรียนและเกรดปัจจุบันในหลักสูตร
ปรับ R-squared แล้ว: 0.946 มีการคำนวณดังนี้:
ปรับแล้ว R 2 = 1 – [(1-R 2 )*(n-1)/(nk-1)] = 1 – [(1-.956)*(12-1)/(12-2-1) ] = 0.946
ซึ่งแสดงถึงค่า R-squared ที่ปรับตามจำนวนตัวแปรตัวทำนายในแบบจำลอง
การวัดนี้จะมีประโยชน์ ตัวอย่างเช่น หากเราใส่โมเดลการถดถอยอีกตัวหนึ่งที่มีตัวทำนาย 10 ตัวได้ และพบว่าค่า R-squared ที่ปรับแล้วของโมเดลนั้นคือ 0.88 นี่จะบ่งชี้ว่าแบบจำลองการถดถอยที่มีตัวทำนายเพียงสองตัวจะดีกว่าเนื่องจากมีค่ากำลังสอง R ที่ปรับแล้วสูงกว่า
แหล่งข้อมูลเพิ่มเติม
รู้เบื้องต้นเกี่ยวกับการถดถอยเชิงเส้นพหุคูณ
ค่า R-กำลังสองที่ดีคืออะไร?