كيفية إجراء اختبار الفرضيات في لغة بايثون (مع أمثلة)
اختبار الفرضية هو اختبار إحصائي رسمي نستخدمه لرفض أو الفشل في رفض فرضية إحصائية.
يشرح هذا البرنامج التعليمي كيفية إجراء اختبارات الفرضيات التالية في بايثون:
- عينة من اختبار t
- اختبار T لعينتين
- اختبار t للعينات المقترنة
دعنا نذهب!
مثال 1: مثال لاختبار t في بايثون
يتم استخدام اختبار t لعينة واحدة لاختبار ما إذا كان متوسط المجتمع يساوي قيمة معينة أم لا.
على سبيل المثال، لنفترض أننا نريد معرفة ما إذا كان متوسط وزن نوع معين من السلاحف هو 310 رطل أم لا.
ولاختبار ذلك قمنا بجمع عينة عشوائية بسيطة من السلاحف بالأوزان التالية:
الوزن : 300، 315، 320، 311، 314، 309، 300، 308، 305، 303، 305، 301، 303
يوضح التعليمة البرمجية التالية كيفية استخدام الدالة tttest_1samp() في مكتبة scipy.stats لإجراء اختبار t لعينة واحدة:
import scipy.stats as stats #define data data = [300, 315, 320, 311, 314, 309, 300, 308, 305, 303, 305, 301, 303] #perform one sample t-test stats. ttest_1samp (a=data, popmean= 310 ) Ttest_1sampResult(statistic=-1.5848116313861254, pvalue=0.1389944275158753)
إحصائيات اختبار t هي -1.5848 والقيمة p المقابلة ثنائية الطرف هي 0.1389 .
الفرضيتين لهذا الاختبار t على عينة معينة هي كما يلي:
- H 0 : μ = 310 (متوسط وزن هذا النوع من السلاحف 310 رطل)
- H A : μ ≠310 (متوسط الوزن ليس 310 رطل)
نظرًا لأن القيمة p للاختبار (0.1389) أكبر من alpha = 0.05، فإننا نفشل في رفض فرضية العدم للاختبار.
ليس لدينا أدلة كافية لنقول أن متوسط وزن هذا النوع بالذات من السلاحف هو أكثر من 310 رطل.
مثال 2: اختبار t من عينتين في بايثون
يتم استخدام اختبار t المكون من عينتين لاختبار ما إذا كانت متوسطات مجتمعين متساويتين أم لا.
على سبيل المثال، لنفترض أننا نريد معرفة ما إذا كان متوسط وزن نوعين مختلفين من السلاحف متساويًا أم لا.
ولاختبار ذلك قمنا بجمع عينة عشوائية بسيطة من السلاحف من كل نوع بالأوزان التالية:
العينة 1 : 300، 315، 320، 311، 314، 309، 300، 308، 305، 303، 305، 301، 303
العينة 2 : 335، 329، 322، 321، 324، 319، 304، 308، 305، 311، 307، 300، 305
يوضح الكود التالي كيفية استخدام الدالة tttest_ind() في مكتبة scipy.stats لإجراء هذين المثالين لاختبار t:
import scipy. stats as stats #define array of turtle weights for each sample sample1 = [300, 315, 320, 311, 314, 309, 300, 308, 305, 303, 305, 301, 303] sample2 = [335, 329, 322, 321, 324, 319, 304, 308, 305, 311, 307, 300, 305] #perform two sample t-tests stats. ttest_ind (a=sample1, b=sample2) Ttest_indResult(statistic=-2.1009029257555696, pvalue=0.04633501389516516)
إحصائيات اختبار t هي -2.1009 والقيمة p المقابلة ثنائية الطرف هي 0.0463 .
الافتراضان الخاصان باختبار t المكون من عينتين هما:
- H 0 : μ 1 = μ 2 (متوسط الوزن بين النوعين متساوي)
- H A : μ 1 ≠ μ 2 (متوسط الوزن بين النوعين غير متساوي)
وبما أن القيمة p للاختبار (0.0463) أقل من 0.05، فإننا نرفض الفرضية الصفرية.
وهذا يعني أن لدينا ما يكفي من الأدلة لنقول أن متوسط الوزن بين النوعين ليس متساويا.
مثال 3: اختبار t للعينات المقترنة في بايثون
يتم استخدام اختبار t للعينات المقترنة لمقارنة متوسطي عينتين عندما يمكن ربط كل ملاحظة في عينة واحدة بملاحظة في العينة الأخرى.
على سبيل المثال، لنفترض أننا نريد معرفة ما إذا كان برنامج تدريبي معين قادرًا على زيادة الحد الأقصى للقفز العمودي (بالبوصة) للاعبي كرة السلة أم لا.
ولاختبار ذلك، يمكننا تعيين عينة عشوائية بسيطة مكونة من 12 لاعب كرة سلة جامعيًا وقياس كل قفزة من قفزاتهم العمودية القصوى. ثم يمكننا أن نجعل كل لاعب يستخدم البرنامج التدريبي لمدة شهر ثم نقيس أقصى قفزة عمودية له مرة أخرى في نهاية الشهر.
توضح البيانات التالية أقصى ارتفاع للقفز (بالبوصة) قبل وبعد استخدام البرنامج التدريبي لكل لاعب:
الامامية : 22, 24, 20, 19, 19, 20, 22, 25, 24, 23, 22, 21
بعد : 23، 25، 20، 24، 18، 22، 23، 28، 24، 25، 24، 20
يوضح الكود التالي كيفية استخدام الدالة tttest_rel() في مكتبة scipy.stats لإجراء اختبار t للعينات المقترنة:
import scipy. stats as stats #define before and after max jump heights before = [22, 24, 20, 19, 19, 20, 22, 25, 24, 23, 22, 21] after = [23, 25, 20, 24, 18, 22, 23, 28, 24, 25, 24, 20] #perform paired samples t-test stats. ttest_rel (a=before, b=after) Ttest_relResult(statistic=-2.5289026942943655, pvalue=0.02802807458682508)
إحصائيات اختبار t هي -2.5289 والقيمة p المقابلة ثنائية الطرف هي 0.0280 .
الافتراضان لهذا الاختبار t للعينات المقترنة هما:
- H 0 : μ 1 = μ 2 (متوسط ارتفاع القفزة قبل وبعد استخدام البرنامج متساوي)
- H A : μ 1 ≠ μ 2 (متوسط ارتفاع القفزة قبل وبعد استخدام البرنامج غير متساوي)
وبما أن القيمة p للاختبار (0.0280) أقل من 0.05، فإننا نرفض الفرضية الصفرية.
وهذا يعني أن لدينا أدلة كافية للقول بأن متوسط ارتفاع القفزة قبل وبعد استخدام البرنامج التدريبي ليس متساويا.
مصادر إضافية
يمكنك استخدام الآلات الحاسبة التالية عبر الإنترنت لإجراء اختبارات t المختلفة تلقائيًا:
مثال على الآلة الحاسبة لاختبار t
آلة حاسبة لاختبار t لعينتين
حاسبة اختبار t للعينات المقترنة