R หลายหรือ r square: อะไรคือความแตกต่าง?

โดย ดร.เบนจามิน แอนเดอร์สัน กรกฎาคม 26, 2023 แนะนำ 0 ความคิดเห็น

เมื่อคุณปรับ โมเดลการถดถอย โดยใช้ซอฟต์แวร์ทางสถิติส่วนใหญ่ คุณจะสังเกตเห็นค่าสองค่าต่อไปนี้ในผลลัพธ์:

หลายค่า R: ค่าสัมประสิทธิ์สหสัมพันธ์พหุคูณระหว่างตัวแปรตั้งแต่ 3 ตัวขึ้นไป

R-Square: ค่านี้คำนวณเป็น (หลาย R) ² และแสดงถึงสัดส่วนของความแปรปรวนใน ตัวแปรตอบ สนองของแบบจำลองการถดถอยที่สามารถอธิบายได้ด้วยตัวแปรทำนาย ค่านี้จะแตกต่างกันไปตั้งแต่ 0 ถึง 1

ในทางปฏิบัติ เรามักจะสนใจค่า R-squared เพราะมันบอกเราว่าตัวแปรทำนายมีประโยชน์อย่างไรในการทำนายค่าของตัวแปรตอบสนอง

อย่างไรก็ตาม ทุกครั้งที่เราเพิ่มตัวแปรทำนายใหม่ให้กับโมเดล ค่า R-squared จะรับประกันว่าจะเพิ่มขึ้น แม้ว่าตัวแปรทำนายจะไม่มีประโยชน์ก็ตาม

R-squared ที่ปรับปรุงแล้ว คือ R-squared เวอร์ชันแก้ไขที่ปรับตามจำนวนตัวทำนายในแบบจำลองการถดถอย มีการคำนวณดังนี้:

ปรับแล้ว R ² = 1 – [(1-R ² )*(n-1)/(nk-1)]

ทอง:

R ² : R ² ของรุ่น
n : จำนวนการสังเกต
k : จำนวนตัวแปรทำนาย

เนื่องจาก R-squared จะเพิ่มขึ้นเสมอเมื่อคุณเพิ่มตัวทำนายให้กับโมเดล R-squared ที่ปรับแล้วจึงสามารถใช้เป็นหน่วยเมตริกที่บอกคุณว่าแบบจำลองมีประโยชน์อย่างไร โดยปรับตามจำนวนตัวทำนายในแบบจำลอง

เพื่อให้เข้าใจคำศัพท์เหล่านี้แต่ละคำได้ดีขึ้น โปรดพิจารณาตัวอย่างต่อไปนี้

ตัวอย่าง: หลายค่า R, R-squared และ R-squared ที่ปรับแล้ว

สมมติว่าเรามีชุดข้อมูลต่อไปนี้ซึ่งมีตัวแปร 3 ตัวต่อไปนี้สำหรับนักเรียน 12 คนที่แตกต่างกัน:

สมมติว่าเราปรับแบบจำลองการถดถอยเชิงเส้นพหุคูณโดยใช้ ชั่วโมงการศึกษา และ เกรดปัจจุบัน เป็นตัวแปรทำนายและ คะแนนการสอบ เป็นตัวแปรตอบสนอง และรับผลลัพธ์ต่อไปนี้:

R หลายตัวเทียบกับ R-squared

เราสามารถสังเกตค่าของสามตัวชี้วัดต่อไปนี้:

หลายค่า R: 0.978 นี่แสดงถึงความสัมพันธ์พหุคูณระหว่างตัวแปรตอบสนองและตัวแปรทำนายทั้งสอง

อาร์ สแควร์: 0.956 . ซึ่งคำนวณเป็น (หลาย R) ² = (0.978) ² = 0.956 ข้อมูลนี้บอกเราว่า 95.6% ของการเปลี่ยนแปลงของคะแนนสอบสามารถอธิบายได้ด้วยจำนวนชั่วโมงที่นักเรียนใช้เวลาเรียนและเกรดปัจจุบันในหลักสูตร

ปรับ R-squared แล้ว: 0.946 มีการคำนวณดังนี้:

ปรับแล้ว R ² = 1 – [(1-R ² )*(n-1)/(nk-1)] = 1 – [(1-.956)*(12-1)/(12-2-1) ] = 0.946

ซึ่งแสดงถึงค่า R-squared ที่ปรับตามจำนวนตัวแปรตัวทำนายในแบบจำลอง

การวัดนี้จะมีประโยชน์ ตัวอย่างเช่น หากเราใส่โมเดลการถดถอยอีกตัวหนึ่งที่มีตัวทำนาย 10 ตัวได้ และพบว่าค่า R-squared ที่ปรับแล้วของโมเดลนั้นคือ 0.88 นี่จะบ่งชี้ว่าแบบจำลองการถดถอยที่มีตัวทำนายเพียงสองตัวจะดีกว่าเนื่องจากมีค่ากำลังสอง R ที่ปรับแล้วสูงกว่า

แหล่งข้อมูลเพิ่มเติม

รู้เบื้องต้นเกี่ยวกับการถดถอยเชิงเส้นพหุคูณ
ค่า R-กำลังสองที่ดีคืออะไร?

เกี่ยวกับผู้แต่ง

ดร.เบนจามิน แอนเดอร์สัน

สวัสดี ฉันชื่อเบนจามิน ศาสตราจารย์สถิติเกษียณอายุแล้ว และผันตัวมาเป็นครูสอนสถิติโดยเฉพาะ ด้วยประสบการณ์และความเชี่ยวชาญที่กว้างขวางในสาขาสถิติ ฉันกระตือรือร้นที่จะแบ่งปันความรู้ของฉันเพื่อเสริมศักยภาพนักเรียนผ่าน Statorials. รู้เพิ่มเติม

ตัวอย่าง: หลายค่า R, R-squared และ R-squared ที่ปรับแล้ว

แหล่งข้อมูลเพิ่มเติม

เกี่ยวกับผู้แต่ง

ดร.เบนจามิน แอนเดอร์สัน

เพิ่มความคิดเห็น