วิธีดำเนินการถดถอยเชิงเส้นอย่างง่ายใน spss


การถดถอยเชิงเส้นอย่างง่าย เป็นวิธีการที่เราสามารถใช้เพื่อทำความเข้าใจความสัมพันธ์ระหว่างตัวแปรทำนายและตัวแปรตอบสนอง

บทช่วยสอนนี้จะอธิบายวิธีการถดถอยเชิงเส้นอย่างง่ายใน SPSS

ตัวอย่าง: การถดถอยเชิงเส้นอย่างง่ายใน SPSS

สมมติว่าเรามีชุดข้อมูลต่อไปนี้ซึ่งแสดงจำนวนชั่วโมงที่เรียนและเกรดการสอบที่นักเรียน 20 คนได้รับ:

ใช้ขั้นตอนต่อไปนี้เพื่อทำการถดถอยเชิงเส้นอย่างง่ายกับชุดข้อมูลนี้เพื่อหาปริมาณความสัมพันธ์ระหว่างชั่วโมงเรียนและคะแนนสอบ:

ขั้นตอนที่ 1: แสดงภาพข้อมูล

ขั้นแรก เราจะสร้างแผนภาพกระจายเพื่อแสดงความสัมพันธ์ระหว่างชั่วโมงและคะแนนเป็นภาพ เพื่อให้แน่ใจว่าความสัมพันธ์ระหว่างตัวแปรทั้งสองดูเหมือนจะเป็นเส้นตรง มิฉะนั้น การใช้การถดถอยเชิงเส้นอย่างง่ายจะไม่ใช่เทคนิคที่เหมาะสม

คลิกแท็บ แผนภูมิ จากนั้นคลิก ตัวสร้างแผนภูมิ :

จากเมนู เลือกจาก คลิกและลาก Scatter/Dot ลงในหน้าต่างแก้ไขหลัก จากนั้นลาก เวลา ของตัวแปรไปไว้บนแกน x และ ลากคะแนน ไปไว้บนแกน y

พล็อตกระจายใน SPSS

เมื่อคุณคลิก ตกลง แผนภาพกระจายต่อไปนี้จะปรากฏขึ้น:

จากกราฟเราจะเห็นได้ว่ามีความสัมพันธ์เชิงเส้นตรงเชิงบวกระหว่างชั่วโมงและคะแนน โดยทั่วไปแล้ว นักเรียนที่เรียนหลายชั่วโมงมักจะได้คะแนนสูงกว่า

เนื่องจากมีความสัมพันธ์เชิงเส้นที่ชัดเจนระหว่างตัวแปรทั้งสอง เราจะดำเนินการปรับแบบจำลองการถดถอยเชิงเส้นอย่างง่ายให้เข้ากับชุดข้อมูล

ขั้นตอนที่ 2: ติดตั้งโมเดลการถดถอยเชิงเส้นอย่างง่าย

คลิกแท็บ วิเคราะห์ จากนั้นคลิก Regression จากนั้นคลิก Linear :

ตัวเลือกการถดถอยเชิงเส้นใน SPSS

ในหน้าต่างใหม่ที่ปรากฏขึ้น ให้ลาก คะแนน ตัวแปรลงในกล่องที่มีข้อความว่า ขึ้นอยู่กับ และลาก ชั่วโมง ลงในกล่องที่มีข้อความว่า เป็นอิสระ จากนั้นคลิก ตกลง

ขั้นตอนที่ 3: ตีความผลลัพธ์

เมื่อคุณคลิก ตกลง ผลลัพธ์การถดถอยเชิงเส้นอย่างง่ายจะปรากฏขึ้น ตารางแรกที่เราสนใจคือตารางชื่อ Model Summary :

ตารางสรุปโมเดลใน SPSS

ต่อไปนี้เป็นวิธีการตีความตัวเลขที่เกี่ยวข้องมากที่สุดในตารางนี้:

  • R Square: นี่คือสัดส่วนของความแปรปรวนในตัวแปรตอบสนองที่สามารถอธิบายได้ด้วยตัวแปรอธิบาย ในตัวอย่างนี้ 50.6% ของความแปรผันของคะแนนสอบสามารถอธิบายได้ด้วยจำนวนชั่วโมงที่เรียน
  • มาตรฐาน. ข้อผิดพลาดในการประมาณค่า: ข้อผิดพลาดมาตรฐาน คือระยะห่างเฉลี่ยระหว่างค่าที่สังเกตได้กับเส้นการถดถอย ในตัวอย่างนี้ ค่าที่สังเกตได้เบี่ยงเบนไปจากเส้นถดถอยโดยเฉลี่ย 5,861 หน่วย

ตารางต่อไปนี้ที่เราสนใจมีชื่อว่า ค่าสัมประสิทธิ์ :

ต่อไปนี้เป็นวิธีการตีความตัวเลขที่เกี่ยวข้องมากที่สุดในตารางนี้:

  • Unstandardized B (ค่าคงที่) : สิ่งนี้บอกเราถึงค่าเฉลี่ยของ ตัวแปรตอบสนอง เมื่อตัวแปรทำนายเป็นศูนย์ ในตัวอย่างนี้ คะแนนสอบเฉลี่ยคือ 73.662 เมื่อชั่วโมงเรียนเป็นศูนย์
  • B ไม่ได้มาตรฐาน (ชั่วโมง): สิ่งนี้บอกเราถึงการเปลี่ยนแปลงโดยเฉลี่ยในตัวแปรการตอบสนองที่เกี่ยวข้องกับการเพิ่มขึ้นของตัวแปรทำนายหนึ่งหน่วย ในตัวอย่างนี้ แต่ละชั่วโมงที่ศึกษาเพิ่มเติมสัมพันธ์กับคะแนนสอบที่เพิ่มขึ้นโดยเฉลี่ย 3,342 คะแนน
  • Sig (ชั่วโมง): นี่คือ ค่า p ที่เกี่ยวข้องกับสถิติการทดสอบระหว่างชั่วโมง ในกรณีนี้ เนื่องจากค่านี้น้อยกว่า 0.05 เราจึงสามารถสรุปได้ว่า ชั่วโมง ตัวแปรของตัวทำนายมีนัยสำคัญทางสถิติ

ในที่สุด เราสามารถสร้างสมการถดถอยโดยใช้ค่า คงที่ และ ชั่วโมง . ในกรณีนี้ สมการจะเป็นดังนี้:

คะแนนสอบโดยประมาณ = 73.662 + 3.342*(ชั่วโมง)

เราสามารถใช้สมการนี้เพื่อหาคะแนนสอบโดยประมาณของนักเรียน โดยพิจารณาจากจำนวนชั่วโมงที่เรียน

ตัวอย่างเช่น นักเรียนที่เรียน 3 ชั่วโมง ควรได้คะแนนสอบ 83.688:

คะแนนสอบโดยประมาณ = 73.662 + 3.342*(3) = 83.688

ขั้นตอนที่ 4: รายงานผลลัพธ์

สุดท้ายนี้ เราต้องการสรุปผลลัพธ์ของการถดถอยเชิงเส้นอย่างง่ายของเรา นี่คือตัวอย่างของวิธีการทำเช่นนี้:

ทำการถดถอยเชิงเส้นอย่างง่ายเพื่อหาปริมาณความสัมพันธ์ระหว่างชั่วโมงเรียนกับเกรดการสอบ ใช้กลุ่มตัวอย่างจำนวน 20 คนในการวิเคราะห์

ผลการวิจัยพบว่ามีความสัมพันธ์ที่มีนัยสำคัญทางสถิติระหว่างชั่วโมงที่เรียนกับเกรดการสอบ (t = 4.297, p < 0.000) และชั่วโมงที่เรียนนั้นคิดเป็น 50.6% ของความแปรปรวนที่อธิบายไว้ในเกรดการสอบ การสอบ.

สมการถดถอยกลายเป็น:

คะแนนสอบโดยประมาณ = 73.662 + 3.342*(ชั่วโมง)

การเรียนรู้เพิ่มเติมแต่ละชั่วโมงสัมพันธ์กับคะแนนสอบที่เพิ่มขึ้น 3,342 โดยเฉลี่ย

แหล่งข้อมูลเพิ่มเติม

บทช่วยสอนต่อไปนี้จะอธิบายวิธีดำเนินการงานทั่วไปอื่นๆ ใน SPSS:

วิธีการดำเนินการถดถอยเชิงเส้นหลายรายการใน SPSS
วิธีดำเนินการถดถอยกำลังสองใน SPSS
วิธีดำเนินการถดถอยโลจิสติกใน SPSS

เพิ่มความคิดเห็น

อีเมลของคุณจะไม่แสดงให้คนอื่นเห็น ช่องข้อมูลจำเป็นถูกทำเครื่องหมาย *