الدليل الكامل: اختبار الفرضيات في r
اختبار الفرضية هو اختبار إحصائي رسمي نستخدمه لرفض أو الفشل في رفض فرضية إحصائية.
يشرح هذا البرنامج التعليمي كيفية إجراء اختبارات الفرضيات التالية في R:
- عينة من اختبار t
- اختبار T لعينتين
- اختبار t للعينات المقترنة
يمكننا استخدام الدالة t.test() في R لإجراء كل نوع من الاختبارات:
#one sample t-test t. test (x, y = NULL, alternative = c(" two.sided ", " less ", " greater "), mu = 0, paired = FALSE, var.equal = FALSE , conf.level = 0.95, …)
ذهب:
- x، y: عينتا البيانات.
- البديل: الفرضية البديلة للاختبار.
- mu: القيمة الحقيقية للمتوسط.
- مقترن: ما إذا كان سيتم إجراء اختبار t مقترن أم لا.
- var.equal: ما إذا كان يجب افتراض أن الفروق متساوية بين العينات.
- conf.level: مستوى الثقة المطلوب استخدامه.
توضح الأمثلة التالية كيفية استخدام هذه الوظيفة عمليًا.
مثال 1: اختبار t لعينة واحدة في R
يتم استخدام اختبار t لعينة واحدة لاختبار ما إذا كان متوسط المجتمع يساوي قيمة معينة أم لا.
على سبيل المثال، لنفترض أننا نريد معرفة ما إذا كان متوسط وزن نوع معين من السلاحف يبلغ 310 أرطال أم لا. نخرج ونجمع عينة عشوائية بسيطة من السلاحف بالأوزان التالية:
الوزن : 300، 315، 320، 311، 314، 309، 300، 308، 305، 303، 305، 301، 303
يوضح الكود التالي كيفية تنفيذ مثال اختبار t هذا في R:
#define vector of turtle weights turtle_weights <- c(300, 315, 320, 311, 314, 309, 300, 308, 305, 303, 305, 301, 303) #perform one sample t-test t. test (x=turtle_weights,mu=310) One Sample t-test data: turtle_weights t = -1.5848, df = 12, p-value = 0.139 alternative hypothesis: true mean is not equal to 310 95 percent confidence interval: 303.4236 311.0379 sample estimates: mean of x 307.2308
ومن النتيجة يمكننا أن نرى:
- إحصائيات اختبار t: -1.5848
- درجات الحرية: 12
- القيمة الاحتمالية: 0.139
- فاصل الثقة 95% للمتوسط الحقيقي: [303.4236، 311.0379]
- متوسط وزن السلاحف: 307,230
وبما أن القيمة p للاختبار (0.139) لا تقل عن 0.05، فإننا نفشل في رفض الفرضية الصفرية.
وهذا يعني أنه ليس لدينا ما يكفي من الأدلة لنقول أن متوسط وزن هذا النوع من السلاحف هو أكثر من 310 رطل.
مثال 2: اختبار t لعينتين في R
يتم استخدام اختبار t المكون من عينتين لاختبار ما إذا كانت متوسطات مجتمعين متساويتين أم لا.
على سبيل المثال، لنفترض أننا نريد معرفة ما إذا كان متوسط وزن نوعين مختلفين من السلاحف متساويًا أم لا. ولاختبار ذلك قمنا بجمع عينة عشوائية بسيطة من السلاحف من كل نوع بالأوزان التالية:
العينة 1 : 300، 315، 320، 311، 314، 309، 300، 308، 305، 303، 305، 301، 303
العينة 2 : 335، 329، 322، 321، 324، 319، 304، 308، 305، 311، 307، 300، 305
يوضح التعليمة البرمجية التالية كيفية تنفيذ هذين المثالين لاختبار t في R:
#define vector of turtle weights for each sample sample1 <- c(300, 315, 320, 311, 314, 309, 300, 308, 305, 303, 305, 301, 303) sample2 <- c(335, 329, 322, 321, 324, 319, 304, 308, 305, 311, 307, 300, 305) #perform two sample t-tests t. test (x = sample1, y = sample2) Welch Two Sample t-test data: sample1 and sample2 t = -2.1009, df = 19.112, p-value = 0.04914 alternative hypothesis: true difference in means is not equal to 0 95 percent confidence interval: -14.73862953 -0.03060124 sample estimates: mean of x mean of y 307.2308 314.6154
ومن النتيجة يمكننا أن نرى:
- إحصائيات اختبار t: -2.1009
- درجات الحرية: 19,112
- القيمة p: 0.04914
- فاصل الثقة 95% لفرق المتوسط الحقيقي: [-14.74، -0.03]
- متوسط وزن العينة 1: 307.2308
- متوسط وزن العينة 2: 314.6154
وبما أن القيمة p للاختبار (0.04914) أقل من 0.05، فإننا نرفض الفرضية الصفرية.
وهذا يعني أن لدينا ما يكفي من الأدلة لنقول أن متوسط الوزن بين النوعين ليس متساويا.
مثال 3: اختبار t للعينات المقترنة في R
يتم استخدام اختبار t للعينات المقترنة لمقارنة متوسطي عينتين عندما يمكن ربط كل ملاحظة في عينة واحدة بملاحظة في العينة الأخرى.
على سبيل المثال، لنفترض أننا نريد معرفة ما إذا كان برنامج تدريبي معين قادرًا على زيادة الحد الأقصى للقفز الرأسي (بالبوصة) للاعبي كرة السلة أم لا.
ولاختبار ذلك، يمكننا تعيين عينة عشوائية بسيطة مكونة من 12 لاعب كرة سلة جامعيًا وقياس كل قفزة من قفزاتهم العمودية القصوى. ثم يمكننا أن نجعل كل لاعب يستخدم البرنامج التدريبي لمدة شهر ثم نقيس أقصى قفزة عمودية له مرة أخرى في نهاية الشهر.
توضح البيانات التالية أقصى ارتفاع للقفز (بالبوصة) قبل وبعد استخدام البرنامج التدريبي لكل لاعب:
الامامية : 22, 24, 20, 19, 19, 20, 22, 25, 24, 23, 22, 21
بعد : 23، 25، 20، 24، 18، 22، 23، 28، 24، 25، 24، 20
يوضح التعليمة البرمجية التالية كيفية إجراء اختبار t للعينات المقترنة في R:
#define before and after max jump heights before <- c(22, 24, 20, 19, 19, 20, 22, 25, 24, 23, 22, 21) after <- c(23, 25, 20, 24, 18, 22, 23, 28, 24, 25, 24, 20) #perform paired samples t-test t. test (x = before, y = after, paired = TRUE ) Paired t-test data: before and after t = -2.5289, df = 11, p-value = 0.02803 alternative hypothesis: true difference in means is not equal to 0 95 percent confidence interval: -2.3379151 -0.1620849 sample estimates: mean of the differences -1.25
ومن النتيجة يمكننا أن نرى:
- إحصائيات اختبار t: -2.5289
- درجات الحرية: 11
- القيمة p: 0.02803
- فاصل الثقة 95% لفرق المتوسط الحقيقي: [-2.34، -0.16]
- متوسط الفرق بين قبل وبعد: -1.25
وبما أن القيمة p للاختبار (0.02803) أقل من 0.05، فإننا نرفض الفرضية الصفرية.
وهذا يعني أن لدينا أدلة كافية للقول بأن متوسط ارتفاع القفزة قبل وبعد استخدام البرنامج التدريبي ليس متساويا.
مصادر إضافية
استخدم الآلات الحاسبة التالية عبر الإنترنت لإجراء اختبارات t المختلفة تلقائيًا:
مثال على آلة حاسبة اختبار t
آلة حاسبة لاختبار t لعينتين
حاسبة اختبار t للعينات المقترنة