วิธีดำเนินการถดถอยเชิงเส้นอย่างง่ายใน spss
การถดถอยเชิงเส้นอย่างง่าย เป็นวิธีการที่เราสามารถใช้เพื่อทำความเข้าใจความสัมพันธ์ระหว่างตัวแปรทำนายและตัวแปรตอบสนอง
บทช่วยสอนนี้จะอธิบายวิธีการถดถอยเชิงเส้นอย่างง่ายใน SPSS
ตัวอย่าง: การถดถอยเชิงเส้นอย่างง่ายใน SPSS
สมมติว่าเรามีชุดข้อมูลต่อไปนี้ซึ่งแสดงจำนวนชั่วโมงที่เรียนและเกรดการสอบที่นักเรียน 20 คนได้รับ:
ใช้ขั้นตอนต่อไปนี้เพื่อทำการถดถอยเชิงเส้นอย่างง่ายกับชุดข้อมูลนี้เพื่อหาปริมาณความสัมพันธ์ระหว่างชั่วโมงเรียนและคะแนนสอบ:
ขั้นตอนที่ 1: แสดงภาพข้อมูล
ขั้นแรก เราจะสร้างแผนภาพกระจายเพื่อแสดงความสัมพันธ์ระหว่างชั่วโมงและคะแนนเป็นภาพ เพื่อให้แน่ใจว่าความสัมพันธ์ระหว่างตัวแปรทั้งสองดูเหมือนจะเป็นเส้นตรง มิฉะนั้น การใช้การถดถอยเชิงเส้นอย่างง่ายจะไม่ใช่เทคนิคที่เหมาะสม
คลิกแท็บ แผนภูมิ จากนั้นคลิก ตัวสร้างแผนภูมิ :
จากเมนู เลือกจาก คลิกและลาก Scatter/Dot ลงในหน้าต่างแก้ไขหลัก จากนั้นลาก เวลา ของตัวแปรไปไว้บนแกน x และ ลากคะแนน ไปไว้บนแกน y
เมื่อคุณคลิก ตกลง แผนภาพกระจายต่อไปนี้จะปรากฏขึ้น:
จากกราฟเราจะเห็นได้ว่ามีความสัมพันธ์เชิงเส้นตรงเชิงบวกระหว่างชั่วโมงและคะแนน โดยทั่วไปแล้ว นักเรียนที่เรียนหลายชั่วโมงมักจะได้คะแนนสูงกว่า
เนื่องจากมีความสัมพันธ์เชิงเส้นที่ชัดเจนระหว่างตัวแปรทั้งสอง เราจะดำเนินการปรับแบบจำลองการถดถอยเชิงเส้นอย่างง่ายให้เข้ากับชุดข้อมูล
ขั้นตอนที่ 2: ติดตั้งโมเดลการถดถอยเชิงเส้นอย่างง่าย
คลิกแท็บ วิเคราะห์ จากนั้นคลิก Regression จากนั้นคลิก Linear :
ในหน้าต่างใหม่ที่ปรากฏขึ้น ให้ลาก คะแนน ตัวแปรลงในกล่องที่มีข้อความว่า ขึ้นอยู่กับ และลาก ชั่วโมง ลงในกล่องที่มีข้อความว่า เป็นอิสระ จากนั้นคลิก ตกลง
ขั้นตอนที่ 3: ตีความผลลัพธ์
เมื่อคุณคลิก ตกลง ผลลัพธ์การถดถอยเชิงเส้นอย่างง่ายจะปรากฏขึ้น ตารางแรกที่เราสนใจคือตารางชื่อ Model Summary :
ต่อไปนี้เป็นวิธีการตีความตัวเลขที่เกี่ยวข้องมากที่สุดในตารางนี้:
- R Square: นี่คือสัดส่วนของความแปรปรวนในตัวแปรตอบสนองที่สามารถอธิบายได้ด้วยตัวแปรอธิบาย ในตัวอย่างนี้ 50.6% ของความแปรผันของคะแนนสอบสามารถอธิบายได้ด้วยจำนวนชั่วโมงที่เรียน
- มาตรฐาน. ข้อผิดพลาดในการประมาณค่า: ข้อผิดพลาดมาตรฐาน คือระยะห่างเฉลี่ยระหว่างค่าที่สังเกตได้กับเส้นการถดถอย ในตัวอย่างนี้ ค่าที่สังเกตได้เบี่ยงเบนไปจากเส้นถดถอยโดยเฉลี่ย 5,861 หน่วย
ตารางต่อไปนี้ที่เราสนใจมีชื่อว่า ค่าสัมประสิทธิ์ :
ต่อไปนี้เป็นวิธีการตีความตัวเลขที่เกี่ยวข้องมากที่สุดในตารางนี้:
- Unstandardized B (ค่าคงที่) : สิ่งนี้บอกเราถึงค่าเฉลี่ยของ ตัวแปรตอบสนอง เมื่อตัวแปรทำนายเป็นศูนย์ ในตัวอย่างนี้ คะแนนสอบเฉลี่ยคือ 73.662 เมื่อชั่วโมงเรียนเป็นศูนย์
- B ไม่ได้มาตรฐาน (ชั่วโมง): สิ่งนี้บอกเราถึงการเปลี่ยนแปลงโดยเฉลี่ยในตัวแปรการตอบสนองที่เกี่ยวข้องกับการเพิ่มขึ้นของตัวแปรทำนายหนึ่งหน่วย ในตัวอย่างนี้ แต่ละชั่วโมงที่ศึกษาเพิ่มเติมสัมพันธ์กับคะแนนสอบที่เพิ่มขึ้นโดยเฉลี่ย 3,342 คะแนน
- Sig (ชั่วโมง): นี่คือ ค่า p ที่เกี่ยวข้องกับสถิติการทดสอบระหว่างชั่วโมง ในกรณีนี้ เนื่องจากค่านี้น้อยกว่า 0.05 เราจึงสามารถสรุปได้ว่า ชั่วโมง ตัวแปรของตัวทำนายมีนัยสำคัญทางสถิติ
ในที่สุด เราสามารถสร้างสมการถดถอยโดยใช้ค่า คงที่ และ ชั่วโมง . ในกรณีนี้ สมการจะเป็นดังนี้:
คะแนนสอบโดยประมาณ = 73.662 + 3.342*(ชั่วโมง)
เราสามารถใช้สมการนี้เพื่อหาคะแนนสอบโดยประมาณของนักเรียน โดยพิจารณาจากจำนวนชั่วโมงที่เรียน
ตัวอย่างเช่น นักเรียนที่เรียน 3 ชั่วโมง ควรได้คะแนนสอบ 83.688:
คะแนนสอบโดยประมาณ = 73.662 + 3.342*(3) = 83.688
ขั้นตอนที่ 4: รายงานผลลัพธ์
สุดท้ายนี้ เราต้องการสรุปผลลัพธ์ของการถดถอยเชิงเส้นอย่างง่ายของเรา นี่คือตัวอย่างของวิธีการทำเช่นนี้:
ทำการถดถอยเชิงเส้นอย่างง่ายเพื่อหาปริมาณความสัมพันธ์ระหว่างชั่วโมงเรียนกับเกรดการสอบ ใช้กลุ่มตัวอย่างจำนวน 20 คนในการวิเคราะห์
ผลการวิจัยพบว่ามีความสัมพันธ์ที่มีนัยสำคัญทางสถิติระหว่างชั่วโมงที่เรียนกับเกรดการสอบ (t = 4.297, p < 0.000) และชั่วโมงที่เรียนนั้นคิดเป็น 50.6% ของความแปรปรวนที่อธิบายไว้ในเกรดการสอบ การสอบ.
สมการถดถอยกลายเป็น:
คะแนนสอบโดยประมาณ = 73.662 + 3.342*(ชั่วโมง)
การเรียนรู้เพิ่มเติมแต่ละชั่วโมงสัมพันธ์กับคะแนนสอบที่เพิ่มขึ้น 3,342 โดยเฉลี่ย
แหล่งข้อมูลเพิ่มเติม
บทช่วยสอนต่อไปนี้จะอธิบายวิธีดำเนินการงานทั่วไปอื่นๆ ใน SPSS:
วิธีการดำเนินการถดถอยเชิงเส้นหลายรายการใน SPSS
วิธีดำเนินการถดถอยกำลังสองใน SPSS
วิธีดำเนินการถดถอยโลจิสติกใน SPSS