R หลายหรือ r square: อะไรคือความแตกต่าง?


เมื่อคุณปรับ โมเดลการถดถอย โดยใช้ซอฟต์แวร์ทางสถิติส่วนใหญ่ คุณจะสังเกตเห็นค่าสองค่าต่อไปนี้ในผลลัพธ์:

หลายค่า R: ค่าสัมประสิทธิ์สหสัมพันธ์พหุคูณระหว่างตัวแปรตั้งแต่ 3 ตัวขึ้นไป

R-Square: ค่านี้คำนวณเป็น (หลาย R) 2 และแสดงถึงสัดส่วนของความแปรปรวนใน ตัวแปรตอบ สนองของแบบจำลองการถดถอยที่สามารถอธิบายได้ด้วยตัวแปรทำนาย ค่านี้จะแตกต่างกันไปตั้งแต่ 0 ถึง 1

ในทางปฏิบัติ เรามักจะสนใจค่า R-squared เพราะมันบอกเราว่าตัวแปรทำนายมีประโยชน์อย่างไรในการทำนายค่าของตัวแปรตอบสนอง

อย่างไรก็ตาม ทุกครั้งที่เราเพิ่มตัวแปรทำนายใหม่ให้กับโมเดล ค่า R-squared จะรับประกันว่าจะเพิ่มขึ้น แม้ว่าตัวแปรทำนายจะไม่มีประโยชน์ก็ตาม

R-squared ที่ปรับปรุงแล้ว คือ R-squared เวอร์ชันแก้ไขที่ปรับตามจำนวนตัวทำนายในแบบจำลองการถดถอย มีการคำนวณดังนี้:

ปรับแล้ว R 2 = 1 – [(1-R 2 )*(n-1)/(nk-1)]

ทอง:

  • R 2 : R 2 ของรุ่น
  • n : จำนวนการสังเกต
  • k : จำนวนตัวแปรทำนาย

เนื่องจาก R-squared จะเพิ่มขึ้นเสมอเมื่อคุณเพิ่มตัวทำนายให้กับโมเดล R-squared ที่ปรับแล้วจึงสามารถใช้เป็นหน่วยเมตริกที่บอกคุณว่าแบบจำลองมีประโยชน์อย่างไร โดยปรับตามจำนวนตัวทำนายในแบบจำลอง

เพื่อให้เข้าใจคำศัพท์เหล่านี้แต่ละคำได้ดีขึ้น โปรดพิจารณาตัวอย่างต่อไปนี้

ตัวอย่าง: หลายค่า R, R-squared และ R-squared ที่ปรับแล้ว

สมมติว่าเรามีชุดข้อมูลต่อไปนี้ซึ่งมีตัวแปร 3 ตัวต่อไปนี้สำหรับนักเรียน 12 คนที่แตกต่างกัน:

สมมติว่าเราปรับแบบจำลองการถดถอยเชิงเส้นพหุคูณโดยใช้ ชั่วโมงการศึกษา และ เกรดปัจจุบัน เป็นตัวแปรทำนายและ คะแนนการสอบ เป็นตัวแปรตอบสนอง และรับผลลัพธ์ต่อไปนี้:

R หลายตัวเทียบกับ R-squared

เราสามารถสังเกตค่าของสามตัวชี้วัดต่อไปนี้:

หลายค่า R: 0.978 นี่แสดงถึงความสัมพันธ์พหุคูณระหว่างตัวแปรตอบสนองและตัวแปรทำนายทั้งสอง

อาร์ สแควร์: 0.956 . ซึ่งคำนวณเป็น (หลาย R) 2 = (0.978) 2 = 0.956 ข้อมูลนี้บอกเราว่า 95.6% ของการเปลี่ยนแปลงของคะแนนสอบสามารถอธิบายได้ด้วยจำนวนชั่วโมงที่นักเรียนใช้เวลาเรียนและเกรดปัจจุบันในหลักสูตร

ปรับ R-squared แล้ว: 0.946 มีการคำนวณดังนี้:

ปรับแล้ว R 2 = 1 – [(1-R 2 )*(n-1)/(nk-1)] = 1 – [(1-.956)*(12-1)/(12-2-1) ] = 0.946

ซึ่งแสดงถึงค่า R-squared ที่ปรับตามจำนวนตัวแปรตัวทำนายในแบบจำลอง

การวัดนี้จะมีประโยชน์ ตัวอย่างเช่น หากเราใส่โมเดลการถดถอยอีกตัวหนึ่งที่มีตัวทำนาย 10 ตัวได้ และพบว่าค่า R-squared ที่ปรับแล้วของโมเดลนั้นคือ 0.88 นี่จะบ่งชี้ว่าแบบจำลองการถดถอยที่มีตัวทำนายเพียงสองตัวจะดีกว่าเนื่องจากมีค่ากำลังสอง R ที่ปรับแล้วสูงกว่า

แหล่งข้อมูลเพิ่มเติม

รู้เบื้องต้นเกี่ยวกับการถดถอยเชิงเส้นพหุคูณ
ค่า R-กำลังสองที่ดีคืออะไร?

เพิ่มความคิดเห็น

อีเมลของคุณจะไม่แสดงให้คนอื่นเห็น ช่องข้อมูลจำเป็นถูกทำเครื่องหมาย *