วิธีการทดสอบความพอดีของไคสแควร์ใน stata


การทดสอบความดีพอดีของไคสแควร์ ใช้เพื่อพิจารณาว่าตัวแปรเชิงหมวดหมู่เป็นไปตามการแจกแจงเชิงสมมุติหรือไม่

บทช่วยสอนนี้จะอธิบายวิธีดำเนินการทดสอบความพอดีของไคสแควร์ใน Stata

ตัวอย่าง: การทดสอบความพอดีของไคสแควร์ใน Stata

เพื่ออธิบายวิธีดำเนินการทดสอบนี้ เราจะใช้ชุดข้อมูลชื่อ nlsw88 ซึ่งมีข้อมูลเกี่ยวกับสถิติการทำงานของสตรีในสหรัฐอเมริกาในปี 1988

ทำตามขั้นตอนต่อไปนี้เพื่อทำการทดสอบความพอดีของไคสแควร์เพื่อตรวจสอบว่าการกระจายตัวที่แท้จริงของเชื้อชาติในชุดข้อมูลนี้คือ 70% สีขาว, 20% สีดำ, 10% อื่นๆ

ขั้นตอนที่ 1: โหลดและแสดงข้อมูลดิบ

ขั้นแรกเราจะโหลดข้อมูลโดยพิมพ์คำสั่งต่อไปนี้:

ระบบ nlsw88

เราสามารถดูข้อมูลดิบได้โดยพิมพ์คำสั่งต่อไปนี้:

พี่ชาย

ดูข้อมูลดิบใน Stata

แต่ละแถวจะแสดงข้อมูลเกี่ยวกับบุคคล รวมถึงอายุ เชื้อชาติ สถานภาพสมรส ระดับการศึกษา และปัจจัยอื่นๆ มากมาย

ขั้นตอนที่ 2: โหลดแพ็คเกจการปรับแต่ง

เพื่อดำเนินการทดสอบความเหมาะสม เราจะต้องติดตั้งแพ็คเกจ csgof เราสามารถทำได้โดยพิมพ์คำสั่งต่อไปนี้:

หาซีเอสกอฟ

หน้าต่างใหม่จะปรากฏขึ้น คลิกที่ลิงค์ที่ระบุว่า csgof จาก https://stats.idre.ucla.edu/stat/stata/ado/analysis

หน้าต่างอื่นจะปรากฏขึ้น คลิกลิงก์ที่ระบุว่า คลิกที่นี่เพื่อติดตั้ง

การติดตั้งแพ็คเกจควรใช้เวลาเพียงไม่กี่วินาที

ขั้นตอนที่ 3: ทำการทดสอบความพอดี

เมื่อติดตั้งแพ็คเกจแล้ว เราสามารถทำการทดสอบความพอดีของข้อมูลเพื่อพิจารณาว่าการแบ่งแยกการแข่งขันที่แท้จริงคือ: สีขาว 70% สีดำ 20% และอื่นๆ 10%

เราจะใช้ไวยากรณ์ต่อไปนี้เพื่อทำการทดสอบ:

csgof ตัวแปร_of_interest, expperc (list_of_expected_percentages)

นี่คือไวยากรณ์ที่แน่นอนที่เราจะใช้ในกรณีของเรา:

เรียกใช้ csgof, expperc (70, 20, 10)

ความดีของความพอดีของไคสแควร์ในสตาตะ

ต่อไปนี้เป็นวิธีการตีความผลลัพธ์:

กล่องสรุป: กล่องนี้แสดงเปอร์เซ็นต์ที่คาดหวัง ความถี่ที่คาดหวัง และความถี่ที่สังเกตได้สำหรับแต่ละการแข่งขัน ตัวอย่างเช่น:

  • เปอร์เซ็นต์ที่คาดหวังของคนผิวขาวคือ 70% นี่คือเปอร์เซ็นต์ที่เราระบุ
  • ความถี่ที่คาดหวังของคนผิวขาวคือ 1,572.2 ซึ่งคำนวณโดยใช้ข้อเท็จจริงที่ว่ามีบุคคล 2,246 คนในชุดข้อมูล ดังนั้น 70% ของจำนวนนั้นจึงเป็น 1,572.2
  • ความถี่ที่สังเกตได้ของคนผิวขาวคือ 1,637 คน นี่คือจำนวนที่แท้จริงของคนผิวขาวในชุดข้อมูล

Chisq(2): นี่คือสถิติการทดสอบไคสแควร์สำหรับการทดสอบความดีของความฟิต กลายเป็น 218.13.

p: นี่คือค่า p ที่เกี่ยวข้องกับสถิติการทดสอบไคสแควร์ กลายเป็น 0 เนื่องจากมีค่าน้อยกว่า 0.05 เราจึงล้มเหลวในการปฏิเสธสมมติฐานว่างๆ ที่ว่าการกระจายทางเชื้อชาติที่แท้จริงคือ คนผิวขาว 70% คนผิวดำ 20% และคนอื่นๆ 10% เรามีหลักฐานเพียงพอที่จะสรุปว่าการกระจายทางเชื้อชาติที่แท้จริงแตกต่างจากการกระจายเชิงสมมุตินี้

เพิ่มความคิดเห็น

อีเมลของคุณจะไม่แสดงให้คนอื่นเห็น ช่องข้อมูลจำเป็นถูกทำเครื่องหมาย *