كيفية إجراء اختبارات الحالة الطبيعية متعددة المتغيرات في r
عندما نريد اختبار ما إذا كان متغير واحد يتم توزيعه بشكل طبيعي أم لا، يمكننا إنشاء مخطط QQ لتصور التوزيع أو إجراء اختبار إحصائي رسمي مثل اختبار أندرسون دارلينج أو اختبار جارك بيرا .
ومع ذلك، عندما نريد اختبار ما إذا كانت المتغيرات المتعددة موزعة بشكل طبيعي كمجموعة، نحتاج إلى إجراء اختبار الحالة الطبيعية متعدد المتغيرات .
يشرح هذا البرنامج التعليمي كيفية إجراء اختبارات الحالة الطبيعية متعددة المتغيرات التالية لمجموعة بيانات معينة في R:
- اختبار مارديا
- اختبار الطاقة
- اختبارات التفرطح والتواءات متعددة المتغيرات
ذات صلة: إذا أردنا تحديد القيم المتطرفة في سياق متعدد المتغيرات، فيمكننا استخدام مسافة ماهالانوبيس .
مثال: اختبار مارديا في R
يحدد اختبار مارديا ما إذا كانت مجموعة من المتغيرات تتبع التوزيع الطبيعي متعدد المتغيرات أم لا. الفرضيات الصفرية والبديلة للاختبار هي كما يلي:
H 0 (خالية): تتبع المتغيرات التوزيع الطبيعي متعدد المتغيرات.
H a (بديل): لا تتبع المتغيرات التوزيع الطبيعي متعدد المتغيرات.
يوضح التعليمة البرمجية التالية كيفية إجراء هذا الاختبار في R باستخدام حزمة QuantPsyc :
library (QuantPsyc) #create dataset set.seed(0) data <- data.frame(x1 = rnorm(50), x2 = rnorm(50), x3 = rnorm(50)) #perform Multivariate normality test mult.norm(data)$ mult.test Beta-hat kappa p-val Skewness 1.630474 13.5872843 0.1926626 Kurtosis 13.895364 -0.7130395 0.4758213
تختبر الدالة mult.norm() الحالة الطبيعية متعددة المتغيرات في كل من التواء وتفرطح مجموعة البيانات. وبما أن القيمتين p لا تقل عن 0.05، فإننا نفشل في رفض الفرضية الصفرية للاختبار. ليس لدينا أي دليل على أن المتغيرات الثلاثة في مجموعة البيانات لدينا لا تتبع التوزيع متعدد المتغيرات.
مثال: اختبار الطاقة في R
اختبار الطاقة هو اختبار إحصائي آخر يحدد ما إذا كانت مجموعة من المتغيرات تتبع التوزيع الطبيعي متعدد المتغيرات أم لا. الفرضيات الصفرية والبديلة للاختبار هي كما يلي:
H 0 (خالية): تتبع المتغيرات التوزيع الطبيعي متعدد المتغيرات.
H a (بديل): لا تتبع المتغيرات التوزيع الطبيعي متعدد المتغيرات.
يوضح الكود التالي كيفية إجراء هذا الاختبار في R باستخدام حزمة الطاقة :
library (energy) #create dataset set.seed(0) data <- data.frame(x1 = rnorm(50), x2 = rnorm(50), x3 = rnorm(50)) #perform Multivariate normality test mvnorm.etest(data, R= 100 ) Energy test of multivariate normality: estimated parameters data: x, sample size 50, dimension 3, replicates 100 E-statistic = 0.90923, p-value = 0.31
القيمة p للاختبار هي 0.31 . وبما أن هذا الرقم لا يقل عن 0.05، فإننا نفشل في رفض الفرضية الصفرية للاختبار. ليس لدينا أي دليل على أن المتغيرات الثلاثة في مجموعة البيانات لدينا لا تتبع التوزيع متعدد المتغيرات.
ملاحظة: تحدد الوسيطة R=100 100 نسخة متماثلة تم تعيينها للتعزيز لاستخدامها عند تشغيل الاختبار. بالنسبة لمجموعات البيانات ذات أحجام العينات الأصغر، يمكنك زيادة هذا العدد لإنتاج تقدير أكثر موثوقية لإحصائيات الاختبار.
مصادر إضافية
كيفية إنشاء وتفسير مؤامرة QQ في R
كيفية إجراء اختبار أندرسون-دارلينج في R
كيفية إجراء اختبار Jarque-Bera في R
كيفية إجراء اختبار شابيرو ويلك في R