كيفية إجراء اختبار جودة مربع كاي في stata
يتم استخدام اختبار جودة الملاءمة لمربع كاي لتحديد ما إذا كان المتغير القاطع يتبع توزيعًا افتراضيًا أم لا.
يشرح هذا البرنامج التعليمي كيفية إجراء اختبار جودة الملاءمة لمربع كاي في Stata.
مثال: اختبار جودة الملاءمة لمربع كاي في ستاتا
لتوضيح كيفية إجراء هذا الاختبار، سوف نستخدم مجموعة بيانات تسمى nlsw88 ، والتي تحتوي على معلومات عن إحصاءات عمل المرأة في الولايات المتحدة في عام 1988.
اتبع الخطوات التالية لإجراء اختبار مدى ملاءمة مربع كاي لتحديد ما إذا كان التوزيع الحقيقي للعرق في مجموعة البيانات هذه هو: 70% أبيض، 20% أسود، 10% أخرى.
الخطوة 1: تحميل وعرض البيانات الأولية.
أولاً، سنقوم بتحميل البيانات عن طريق كتابة الأمر التالي:
نظام nlsw88
يمكننا عرض البيانات الأولية عن طريق كتابة الأمر التالي:
ر
يعرض كل صف معلومات حول الفرد، بما في ذلك العمر والعرق والحالة الاجتماعية ومستوى التعليم وعوامل أخرى مختلفة.
الخطوة 2: قم بتحميل حزمة التعديل.
لإجراء اختبار الملاءمة، سنحتاج إلى تثبيت حزمة csgof . يمكننا القيام بذلك عن طريق كتابة الأمر التالي:
العثور على csgof
سوف تظهر نافذة جديدة. انقر على الرابط الذي يشير إلى csgof من https://stats.idre.ucla.edu/stat/stata/ado/analogy .
ستظهر نافذة أخرى. انقر فوق الرابط الذي يقول انقر هنا للتثبيت .
يجب أن يستغرق تثبيت الحزمة بضع ثوانٍ فقط.
الخطوة 3: إجراء اختبار الملاءمة.
بمجرد تثبيت الحزمة، يمكننا إجراء اختبار مدى ملاءمة البيانات لتحديد ما إذا كان تقسيم العرق الحقيقي هو: 70% أبيض، 20% أسود، 10% أخرى.
سوف نستخدم بناء الجملة التالي لإجراء الاختبار:
csgofvari_of_interest، experc(list_of_expected_percentages)
إليك الصيغة الدقيقة التي سنستخدمها في حالتنا:
تشغيل csgof، experc (70، 20، 10)
وإليك كيفية تفسير النتيجة:
مربع الملخص: يوضح لنا هذا المربع النسبة المئوية المتوقعة والتكرار المتوقع والتكرار الملاحظ لكل سباق. على سبيل المثال:
- وكانت النسبة المتوقعة للأفراد البيض 70%. وهذه هي النسبة التي حددناها.
- وكان التكرار المتوقع للأفراد البيض 1572.2. يتم حساب ذلك باستخدام حقيقة وجود 2,246 فردًا في مجموعة البيانات، لذا فإن 70% من هذا العدد هو 1,572.2.
- وكان التردد الملحوظ للأفراد البيض 1637. هذا هو العدد الفعلي للأفراد البيض في مجموعة البيانات.
Chisq(2): هذه هي إحصائية اختبار Chi-square لاختبار جودة الملاءمة. وتبين أن 218.13.
p: هذه هي القيمة p المرتبطة بإحصائيات اختبار Chi-square. وتبين أنها 0. وبما أنها أقل من 0.05، فإننا نفشل في رفض فرضية العدم القائلة بأن التوزيع العرقي الحقيقي هو 70% من البيض، و20% من السود، و10% آخرين. لدينا ما يكفي من الأدلة لنستنتج أن التوزيع العرقي الحقيقي يختلف عن هذا التوزيع الافتراضي.