كيفية إجراء اختبار jarque-bera في r
اختبار Jarque-Bera هو اختبار جودة المطابقة الذي يحدد ما إذا كانت بيانات العينة تظهر انحرافًا وتفرطحًا يتوافق معالتوزيع الطبيعي أم لا.
تكون إحصائية اختبار Jarque-Bera دائمًا رقمًا موجبًا وإذا كانت بعيدة عن الصفر، فهذا يشير إلى أن بيانات العينة ليس لها توزيع طبيعي.
يتم تعريف إحصائية اختبار JB على النحو التالي:
JB =[(n-k+1) / 6] * [S 2 + (0.25*(C-3) 2 )]
حيث n هو عدد الملاحظات في العينة، وk هو عدد التراجعات (k = 1 إذا لم يتم استخدامه في سياق الانحدار)، وS هو انحراف العينة، و C هو التفرطح في العينة.
في ظل الفرضية الصفرية للحياة الطبيعية ، JB ~
يشرح هذا البرنامج التعليمي كيفية إجراء اختبار Jarque-Bera في R.
اختبار جارك بيرا في R
لإجراء اختبار Jarque-Bera لمجموعة بيانات نموذجية، يمكننا استخدام حزمة tseries :
#install (if not already installed) and load tseries package if(!require(tseries)){install.packages('tseries')} #generate a list of 100 normally distributed random variables dataset <- rnorm(100) #conduct Jarque-Bera test jarque.bera.test(dataset)
يؤدي هذا إلى إنشاء الإخراج التالي:
يخبرنا هذا أن إحصائيات الاختبار هي 0.67446 وأن قيمة الاختبار p هي 0.7137. في هذه الحالة، لن نتمكن من رفض الفرضية الصفرية القائلة بأن البيانات يتم توزيعها بشكل طبيعي.
لا ينبغي أن تكون هذه النتيجة مفاجئة نظرًا لأن مجموعة البيانات التي أنشأناها تتكون من 100 متغير عشوائي يتبع التوزيع الطبيعي.
بدلًا من ذلك، فكر فيما إذا قمنا بإنشاء مجموعة بيانات تتكون من قائمة مكونة من 100 متغير عشوائي موزع بشكل موحد:
#install (if not already installed) and load tseries package if(!require(tseries)){install.packages('tseries')} #generate a list of 100 uniformly distributed random variables dataset <- runif(100) #conduct Jarque-Bera test jarque.bera.test(dataset)
يؤدي هذا إلى إنشاء الإخراج التالي:
يخبرنا هذا أن إحصائيات الاختبار هي 8.0807 وأن قيمة الاختبار p هي 0.01759. في هذه الحالة، نرفض الفرضية الصفرية القائلة بأن البيانات يتم توزيعها بشكل طبيعي. لدينا ما يكفي من الأدلة لنقول أن البيانات في هذا المثال لا يتم توزيعها بشكل طبيعي.
لا ينبغي أن تكون هذه النتيجة مفاجئة نظرًا لأن مجموعة البيانات التي أنشأناها تتكون من 100 متغير عشوائي يتبع توزيعًا موحدًا. ففي نهاية المطاف، من المفترض أن يتم توزيع البيانات بشكل موحد، وليس بشكل طبيعي.