كيفية إجراء اختبارات الحالة الطبيعية متعددة المتغيرات في r


عندما نريد اختبار ما إذا كان متغير واحد يتم توزيعه بشكل طبيعي أم لا، يمكننا إنشاء مخطط QQ لتصور التوزيع أو إجراء اختبار إحصائي رسمي مثل اختبار أندرسون دارلينج أو اختبار جارك بيرا .

ومع ذلك، عندما نريد اختبار ما إذا كانت المتغيرات المتعددة موزعة بشكل طبيعي كمجموعة، نحتاج إلى إجراء اختبار الحالة الطبيعية متعدد المتغيرات .

يشرح هذا البرنامج التعليمي كيفية إجراء اختبارات الحالة الطبيعية متعددة المتغيرات التالية لمجموعة بيانات معينة في R:

  • اختبار مارديا
  • اختبار الطاقة
  • اختبارات التفرطح والتواءات متعددة المتغيرات

ذات صلة: إذا أردنا تحديد القيم المتطرفة في سياق متعدد المتغيرات، فيمكننا استخدام مسافة ماهالانوبيس .

مثال: اختبار مارديا في R

يحدد اختبار مارديا ما إذا كانت مجموعة من المتغيرات تتبع التوزيع الطبيعي متعدد المتغيرات أم لا. الفرضيات الصفرية والبديلة للاختبار هي كما يلي:

H 0 (خالية): تتبع المتغيرات التوزيع الطبيعي متعدد المتغيرات.

H a (بديل): لا تتبع المتغيرات التوزيع الطبيعي متعدد المتغيرات.

يوضح التعليمة البرمجية التالية كيفية إجراء هذا الاختبار في R باستخدام حزمة QuantPsyc :

 library (QuantPsyc)

#create dataset
set.seed(0)

data <- data.frame(x1 = rnorm(50),
                   x2 = rnorm(50),
                   x3 = rnorm(50))

#perform Multivariate normality test
mult.norm(data)$ mult.test

Beta-hat kappa p-val
Skewness 1.630474 13.5872843 0.1926626
Kurtosis 13.895364 -0.7130395 0.4758213

تختبر الدالة mult.norm() الحالة الطبيعية متعددة المتغيرات في كل من التواء وتفرطح مجموعة البيانات. وبما أن القيمتين p لا تقل عن 0.05، فإننا نفشل في رفض الفرضية الصفرية للاختبار. ليس لدينا أي دليل على أن المتغيرات الثلاثة في مجموعة البيانات لدينا لا تتبع التوزيع متعدد المتغيرات.

مثال: اختبار الطاقة في R

اختبار الطاقة هو اختبار إحصائي آخر يحدد ما إذا كانت مجموعة من المتغيرات تتبع التوزيع الطبيعي متعدد المتغيرات أم لا. الفرضيات الصفرية والبديلة للاختبار هي كما يلي:

H 0 (خالية): تتبع المتغيرات التوزيع الطبيعي متعدد المتغيرات.

H a (بديل): لا تتبع المتغيرات التوزيع الطبيعي متعدد المتغيرات.

يوضح الكود التالي كيفية إجراء هذا الاختبار في R باستخدام حزمة الطاقة :

 library (energy)

#create dataset
set.seed(0)

data <- data.frame(x1 = rnorm(50),
                   x2 = rnorm(50),
                   x3 = rnorm(50))

#perform Multivariate normality test
mvnorm.etest(data, R= 100 )

Energy test of multivariate normality: estimated parameters

data: x, sample size 50, dimension 3, replicates 100
E-statistic = 0.90923, p-value = 0.31

القيمة p للاختبار هي 0.31 . وبما أن هذا الرقم لا يقل عن 0.05، فإننا نفشل في رفض الفرضية الصفرية للاختبار. ليس لدينا أي دليل على أن المتغيرات الثلاثة في مجموعة البيانات لدينا لا تتبع التوزيع متعدد المتغيرات.

ملاحظة: تحدد الوسيطة R=100 100 نسخة متماثلة تم تعيينها للتعزيز لاستخدامها عند تشغيل الاختبار. بالنسبة لمجموعات البيانات ذات أحجام العينات الأصغر، يمكنك زيادة هذا العدد لإنتاج تقدير أكثر موثوقية لإحصائيات الاختبار.

مصادر إضافية

كيفية إنشاء وتفسير مؤامرة QQ في R
كيفية إجراء اختبار أندرسون-دارلينج في R
كيفية إجراء اختبار Jarque-Bera في R
كيفية إجراء اختبار شابيرو ويلك في R

Add a Comment

ایمئیل یایینلانمایاجاق ایسته‎نیله‎ن بوشلوقلار خاللانمیشدیر *