สมการถดถอย

บทความนี้จะอธิบายว่าสมการการถดถอยคืออะไรและใช้เพื่ออะไร ในทำนองเดียวกัน คุณจะได้เรียนรู้วิธีค้นหาสมการการถดถอย แบบฝึกหัดแก้โจทย์ และสุดท้ายคือเครื่องคิดเลขออนไลน์สำหรับคำนวณสมการการถดถอยสำหรับชุดข้อมูลใดๆ

สมการถดถอยคืออะไร?

สมการการถดถอย คือสมการที่เหมาะกับการพล็อตจุดมากที่สุด กล่าวคือ สมการการถดถอยเป็นการประมาณชุดข้อมูลที่ดีที่สุด

สมการการถดถอยอยู่ในรูปแบบ y=β 01 x โดยที่ β 0 คือค่าคงที่ของสมการ และ β 1 คือความชันของสมการ

y=\beta_0+\beta_1x

ถ้าดูสมการถดถอย มันคือสมการเส้นตรง ซึ่งหมายความว่าความสัมพันธ์ระหว่างตัวแปรอิสระ X และตัวแปรตาม Y จะถูกจำลองเป็นความสัมพันธ์เชิงเส้น เนื่องจากเส้นแสดงถึงความสัมพันธ์เชิงเส้น

ดังนั้นสมการการถดถอยช่วยให้เราสามารถเชื่อมโยงตัวแปรอิสระและตัวแปรตามของชุดข้อมูลทางคณิตศาสตร์ได้ แม้ว่าสมการการถดถอยโดยทั่วไปจะไม่สามารถระบุค่าของการสังเกตแต่ละครั้งได้อย่างแม่นยำ แต่ก็ยังใช้เพื่อให้ได้ค่าประมาณของมัน

สมการถดถอย

ดังที่คุณเห็นในแผนภูมิก่อนหน้า สมการการถดถอยช่วยให้เราเห็นแนวโน้มของชุดข้อมูลและประเภทของความสัมพันธ์ที่มีอยู่ระหว่างตัวแปรอิสระและตัวแปรตาม

วิธีการคำนวณสมการถดถอย

สูตรการคำนวณค่าสัมประสิทธิ์ของสมการการถดถอยเชิงเส้นอย่างง่าย มีดังนี้:

\begin{array}{c}\beta_1=\cfrac{\displaystyle \sum_{i=1}^n (x_i-\overline{x})(y_i-\overline{y})}{\displaystyle \sum_{i=1}^n (x_i-\overline{x})^2}\\[12ex]\beta_0=\overline{y}-\beta_1\overline{x}\end{array}

ทอง:

  • \beta_0

    คือค่าคงที่ของสมการถดถอย

  • \beta_1

    คือความชันของสมการถดถอย

  • x_i

    คือค่าของตัวแปรอิสระ X ของข้อมูล i

  • y_i

    คือค่าของตัวแปรตาม Y ของข้อมูล i

  • \overline{x}

    คือค่าเฉลี่ยของค่าของตัวแปรอิสระ

  • \overline{y}

    คือค่าเฉลี่ยของค่าของตัวแปรตาม Y

ตัวอย่างการคำนวณสมการถดถอย

  • หลังจากสอบสถิติ นักเรียน 5 คนถูกถามว่าใช้เวลาเรียนกี่ชั่วโมง ข้อมูลแสดงไว้ในตารางด้านล่าง คำนวณสมการถดถอยจากข้อมูลทางสถิติที่รวบรวมมาเพื่อเชื่อมโยงชั่วโมงเรียนกับเกรดที่ได้รับเชิงเส้นตรง ต่อไปให้พิจารณาว่านักเรียนที่เรียน 8 ชั่วโมงจะได้เกรดเท่าใด

ในการค้นหาสมการการถดถอยสำหรับข้อมูลตัวอย่าง เราต้องกำหนดค่าสัมประสิทธิ์ b 0 และ b 1 ของสมการ และในการทำเช่นนี้ เราจำเป็นต้องใช้สูตรที่เห็นในส่วนด้านบน

อย่างไรก็ตาม เพื่อที่จะใช้สูตรสำหรับสมการการถดถอยเชิงเส้น เราต้องคำนวณค่าเฉลี่ยของตัวแปรอิสระและค่าเฉลี่ยของตัวแปรตามก่อน:

\begin{array}{c}\overline{x}=\cfrac{11+5+10+12+7}{5}=9\\[4ex]\overline{y}=\cfrac{7+4+5+8+6}{5}=6\end{array}

ตอนนี้เรารู้ค่าเฉลี่ยของตัวแปรแล้ว เราก็คำนวณค่าสัมประสิทธิ์ β 1 ของแบบจำลองโดยใช้สูตรที่เกี่ยวข้อง:

\begin{array}{c}\beta_1=\cfrac{\displaystyle \sum_{i=1}^n (x_i-\overline{x})(y_i-\overline{y})}{\displaystyle \sum_{i=1}^n (x_i-\overline{x})^2}\\[10ex] \beta_1=\cfrac{\begin{array}{c}(11-9)(7-6)+(5-9)(4-6)+(10-9)(5-6)+\\+(12-9)(8-6)+(7-9)(6-6)\end{array}}{(11-9)^2+(5-9)^2+(10-9)^2+(12-9)^2+(7-9)^2}\\[6ex]\beta_1=0,4412\end{array}

สุดท้ายเราคำนวณค่าสัมประสิทธิ์ β 0 ของแบบจำลองโดยใช้สูตรที่เกี่ยวข้อง:

\begin{array}{l}\beta_0=\overline{y}-\beta_1\overline{x}\\[3ex]\beta_0=6-0,4412\cdot 9 \\[3ex]\beta_0=2,0294\end{array}

กล่าวโดยสรุป สมการของเส้นการถดถอยเชิงเส้นของปัญหามีดังนี้

y=2,0294+0,4412x

ด้านล่างนี้ คุณจะเห็นการแสดงข้อมูลตัวอย่างแบบกราฟิกพร้อมกับสมการแบบจำลองการถดถอยเชิงเส้นอย่างง่าย:

ตัวอย่างเส้นการถดถอยเชิงเส้น

เมื่อเราคำนวณสมการถดถอยแล้ว เพื่อทำนายเกรดที่นักเรียนที่เรียน 8 ชั่วโมงจะได้รับ ให้แทนที่ค่านี้ลงในสมการถดถอยที่ได้:

y=2,0294+0,4412\cdot 8=5,56

ดังนั้น ตามแบบจำลองการถดถอยเชิงเส้น หากนักเรียนเรียนเป็นเวลา 8 ชั่วโมง เขาจะได้คะแนนสอบ 5.56

เครื่องคำนวณสมการถดถอย

ใส่ข้อมูลตัวอย่างลงในเครื่องคิดเลขด้านล่างเพื่อคำนวณสมการถดถอยของคุณ คุณต้องแยกคู่ข้อมูลเพื่อให้ในกล่องแรกมีเพียงค่าของตัวแปรอิสระ X และในกล่องที่สองมีเพียงค่าของตัวแปรตาม Y

ข้อมูลต้องคั่นด้วยช่องว่างและป้อนโดยใช้จุดเป็นตัวคั่นทศนิยม

  • ตัวแปรอิสระ

  • ตัวแปรตาม Y:

สมการถดถอยเชิงเส้นพหุคูณ

เราเพิ่งเห็นว่าสมการการถดถอยเชิงเส้นอย่างง่ายคืออะไร อย่างไรก็ตาม ตัวแบบการถดถอยอาจเป็นตัวแบบการถดถอยเชิงเส้นหลายตัว ซึ่งรวมถึงตัวแปรอิสระตั้งแต่สองตัวขึ้นไป ดังนั้น การถดถอยเชิงเส้นพหุคูณทำให้สามารถเชื่อมโยงตัวแปรอธิบายหลายตัวกับตัวแปรตอบสนองเชิงเส้นได้

สมการสำหรับแบบจำลองการถดถอยเชิงเส้นพหุคูณ คือ:

y=\beta_0+\beta_1 x_1+\beta_2 x_2+\dots+\beta_m x_m+\varepsilon

ทอง:

  • y

    เป็นตัวแปรตาม

  • x_i

    คือตัวแปรอิสระ i

  • \beta_0

    คือค่าคงที่ของสมการการถดถอยเชิงเส้นพหุคูณ

  • \beta_i

    คือค่าสัมประสิทธิ์การถดถอยที่เกี่ยวข้องกับตัวแปร

    x_i

    .

  • \bm{\varepsilon}

    คือข้อผิดพลาดหรือค่าตกค้าง กล่าวคือ ความแตกต่างระหว่างค่าที่สังเกตได้กับค่าที่ประเมินโดยแบบจำลอง

  • m

    คือจำนวนตัวแปรทั้งหมดในโมเดล

แล้วถ้าเรามีตัวอย่างที่มีผลรวมเป็น

n

จากการสังเกต เราสามารถวางโมเดลการถดถอยเชิงเส้นพหุคูณในรูปแบบเมทริกซ์ได้:

\begin{pmatrix}y_1\\y_2\\\vdots\\y_n\end{pmatrix}=\begin{pmatrix}1&x_{11}&\dots&x_{1m}\\1&x_{21}&\dots&x_{2m}\\ \vdots&\vdots&\ddots&\vdots\\1&x_{n1}&\dots&x_{nm}\end{pmatrix}\cdot\begin{pmatrix}\beta_0\\\beta_1\\\vdots\\\beta_m\end{pmatrix}+\begin{pmatrix}\varepsilon_1\\\varepsilon_2\\\vdots\\\varepsilon_n\end{pmatrix}

นิพจน์เมทริกซ์ด้านบนสามารถเขียนใหม่ได้โดยกำหนดตัวอักษรให้กับแต่ละเมทริกซ์:

Y=X\beta+\varepsilon

ดังนั้น เมื่อใช้เกณฑ์กำลังสองน้อยที่สุด เราก็จะได้ สูตรในการประมาณค่าสัมประสิทธิ์ของสมการการถดถอยเชิงเส้นพหุคูณได้ :

\widehat{\beta}=\left(X^tX\right)^{-1}X^tY

อย่างไรก็ตาม การใช้สูตรนี้ต้องใช้ความพยายามมากและใช้เวลานาน ซึ่งเป็นเหตุผลว่าทำไมในทางปฏิบัติจึงแนะนำให้ใช้ซอฟต์แวร์คอมพิวเตอร์ (เช่น Minitab หรือ Excel) ซึ่งช่วยให้การสร้างแบบจำลองการถดถอยพหุคูณทำได้รวดเร็วยิ่งขึ้น

เพิ่มความคิดเห็น

อีเมลของคุณจะไม่แสดงให้คนอื่นเห็น ช่องข้อมูลจำเป็นถูกทำเครื่องหมาย *