اختبار كولموجوروف-سميرنوف في r (مع أمثلة)


يستخدم اختبار كولموجوروف-سميرنوف لاختبار ما إذا كانت العينة تأتي من توزيع معين أم لا.

لإجراء اختبار Kolmogorov-Smirnov من عينة واحدة أو عينتين في لغة R، يمكننا استخدام الدالة ks.test() .

يعرض هذا البرنامج التعليمي مثالاً لكيفية استخدام هذه الميزة عمليًا.

مثال 1: عينة اختبار كولموجوروف-سميرنوف

لنفترض أن لدينا بيانات العينة التالية:

 #make this example reproducible
seed(0)

#generate dataset of 100 values that follows a Poisson distribution with mean=5
data <- rpois(n= 20 , lambda= 5 )

ذات صلة: دليل إلى dpois وppois وqpois وrpois في R

يوضح الكود التالي كيفية إجراء اختبار Kolmogorov-Smirnov على هذه العينة المكونة من 100 قيمة بيانات لتحديد ما إذا كانت تأتي من التوزيع الطبيعي:

 #perform Kolmogorov-Smirnov test
ks.test(data, “ pnorm ”)

	One-sample Kolmogorov–Smirnov test

data:data
D = 0.97725, p-value < 2.2e-16
alternative hypothesis: two-sided

من النتيجة يمكننا أن نرى أن إحصائيات الاختبار هي 0.97725 والقيمة p المقابلة هي 2.2e-16 . وبما أن القيمة p أقل من 0.05، فإننا نرفض فرضية العدم. لدينا ما يكفي من الأدلة لنقول أن بيانات العينة لا تأتي من التوزيع الطبيعي.

لا ينبغي أن تكون هذه النتيجة مفاجئة لأننا أنشأنا بيانات العينة باستخدام الدالة rpois() ، التي تولد قيمًا عشوائية تتبع توزيع بواسون .

مثال 2: اختبار كولموجوروف-سميرنوف المكون من عينتين

لنفترض أن لدينا مجموعتي البيانات النموذجيتين التاليتين:

 #make this example reproducible
seed(0)

#generate two datasets
data1 <- rpois(n= 20 , lambda= 5 )
data2 <- rnorm( 100 )

يوضح الكود التالي كيفية إجراء اختبار Kolmogorov-Smirnov على هاتين العينتين لتحديد ما إذا كانا ينتميان إلى نفس التوزيع:

 #perform Kolmogorov-Smirnov test
ks.test(data1, data2)

	Two-sample Kolmogorov–Smirnov test

data: data1 and data2
D = 0.99, p-value = 1.299e-14
alternative hypothesis: two-sided

من النتيجة، يمكننا أن نرى أن إحصائيات الاختبار هي 0.99 والقيمة p المقابلة هي 1.299e-14 . وبما أن القيمة p أقل من 0.05، فإننا نرفض فرضية العدم. لدينا ما يكفي من الأدلة لنقول أن مجموعتي البيانات العينتين ليستا من نفس التوزيع.

ولا ينبغي أن تكون هذه النتيجة مفاجئة أيضًا حيث أننا قمنا بتوليد قيم للعينة الأولى باستخدام توزيع بواسون وقيم للعينة الثانية باستخدام التوزيع الطبيعي .

مصادر إضافية

كيفية إجراء اختبار شابيرو ويلك في R
كيفية إجراء اختبار أندرسون-دارلينج في R
كيفية إجراء اختبارات الحالة الطبيعية متعددة المتغيرات في R

Add a Comment

ایمئیل یایینلانمایاجاق ایسته‎نیله‎ن بوشلوقلار خاللانمیشدیر *