วิธีการทดสอบความพอดีของไคสแควร์ใน stata
การทดสอบความดีพอดีของไคสแควร์ ใช้เพื่อพิจารณาว่าตัวแปรเชิงหมวดหมู่เป็นไปตามการแจกแจงเชิงสมมุติหรือไม่
บทช่วยสอนนี้จะอธิบายวิธีดำเนินการทดสอบความพอดีของไคสแควร์ใน Stata
ตัวอย่าง: การทดสอบความพอดีของไคสแควร์ใน Stata
เพื่ออธิบายวิธีดำเนินการทดสอบนี้ เราจะใช้ชุดข้อมูลชื่อ nlsw88 ซึ่งมีข้อมูลเกี่ยวกับสถิติการทำงานของสตรีในสหรัฐอเมริกาในปี 1988
ทำตามขั้นตอนต่อไปนี้เพื่อทำการทดสอบความพอดีของไคสแควร์เพื่อตรวจสอบว่าการกระจายตัวที่แท้จริงของเชื้อชาติในชุดข้อมูลนี้คือ 70% สีขาว, 20% สีดำ, 10% อื่นๆ
ขั้นตอนที่ 1: โหลดและแสดงข้อมูลดิบ
ขั้นแรกเราจะโหลดข้อมูลโดยพิมพ์คำสั่งต่อไปนี้:
ระบบ nlsw88
เราสามารถดูข้อมูลดิบได้โดยพิมพ์คำสั่งต่อไปนี้:
พี่ชาย
แต่ละแถวจะแสดงข้อมูลเกี่ยวกับบุคคล รวมถึงอายุ เชื้อชาติ สถานภาพสมรส ระดับการศึกษา และปัจจัยอื่นๆ มากมาย
ขั้นตอนที่ 2: โหลดแพ็คเกจการปรับแต่ง
เพื่อดำเนินการทดสอบความเหมาะสม เราจะต้องติดตั้งแพ็คเกจ csgof เราสามารถทำได้โดยพิมพ์คำสั่งต่อไปนี้:
หาซีเอสกอฟ
หน้าต่างใหม่จะปรากฏขึ้น คลิกที่ลิงค์ที่ระบุว่า csgof จาก https://stats.idre.ucla.edu/stat/stata/ado/analysis
หน้าต่างอื่นจะปรากฏขึ้น คลิกลิงก์ที่ระบุว่า คลิกที่นี่เพื่อติดตั้ง
การติดตั้งแพ็คเกจควรใช้เวลาเพียงไม่กี่วินาที
ขั้นตอนที่ 3: ทำการทดสอบความพอดี
เมื่อติดตั้งแพ็คเกจแล้ว เราสามารถทำการทดสอบความพอดีของข้อมูลเพื่อพิจารณาว่าการแบ่งแยกการแข่งขันที่แท้จริงคือ: สีขาว 70% สีดำ 20% และอื่นๆ 10%
เราจะใช้ไวยากรณ์ต่อไปนี้เพื่อทำการทดสอบ:
csgof ตัวแปร_of_interest, expperc (list_of_expected_percentages)
นี่คือไวยากรณ์ที่แน่นอนที่เราจะใช้ในกรณีของเรา:
เรียกใช้ csgof, expperc (70, 20, 10)
ต่อไปนี้เป็นวิธีการตีความผลลัพธ์:
กล่องสรุป: กล่องนี้แสดงเปอร์เซ็นต์ที่คาดหวัง ความถี่ที่คาดหวัง และความถี่ที่สังเกตได้สำหรับแต่ละการแข่งขัน ตัวอย่างเช่น:
- เปอร์เซ็นต์ที่คาดหวังของคนผิวขาวคือ 70% นี่คือเปอร์เซ็นต์ที่เราระบุ
- ความถี่ที่คาดหวังของคนผิวขาวคือ 1,572.2 ซึ่งคำนวณโดยใช้ข้อเท็จจริงที่ว่ามีบุคคล 2,246 คนในชุดข้อมูล ดังนั้น 70% ของจำนวนนั้นจึงเป็น 1,572.2
- ความถี่ที่สังเกตได้ของคนผิวขาวคือ 1,637 คน นี่คือจำนวนที่แท้จริงของคนผิวขาวในชุดข้อมูล
Chisq(2): นี่คือสถิติการทดสอบไคสแควร์สำหรับการทดสอบความดีของความฟิต กลายเป็น 218.13.
p: นี่คือค่า p ที่เกี่ยวข้องกับสถิติการทดสอบไคสแควร์ กลายเป็น 0 เนื่องจากมีค่าน้อยกว่า 0.05 เราจึงล้มเหลวในการปฏิเสธสมมติฐานว่างๆ ที่ว่าการกระจายทางเชื้อชาติที่แท้จริงคือ คนผิวขาว 70% คนผิวดำ 20% และคนอื่นๆ 10% เรามีหลักฐานเพียงพอที่จะสรุปว่าการกระจายทางเชื้อชาติที่แท้จริงแตกต่างจากการกระจายเชิงสมมุตินี้