كيفية حساب الخطأ القياسي في bootstrap في r
Bootstrapping هي طريقة يمكن استخدامها لتقدير الخطأ المعياري للمتوسط.
العملية الأساسية لحساب الخطأ القياسي التمهيدي هي كما يلي:
- خذ عينات متكررة مع الاستبدال من مجموعة بيانات معينة.
- لكل عينة، حساب الخطأ القياسي: s/√ n
- وينتج عن هذا تقديرات مختلفة للخطأ المعياري. للعثور على الخطأ القياسي التمهيدي، خذ متوسط الأخطاء القياسية k .
تشرح الأمثلة التالية طريقتين مختلفتين يمكن استخدامهما لحساب الخطأ القياسي التمهيدي في R.
الطريقة الأولى: استخدام حزمة البداية
إحدى الطرق لحساب خطأ التمهيد القياسي في R هي استخدام وظيفة التمهيد () من مكتبة التمهيد .
يوضح التعليمة البرمجية التالية كيفية حساب الخطأ القياسي في bootstrap لمجموعة بيانات معينة في R:
#make this example reproducible set. seeds (10) #load boot library library (boot) #define dataset x <- c(12, 14, 14, 15, 18, 21, 25, 29, 32, 35) #define function to calculate mean meanFunc <- function (x,i){mean(x[i])} #calculate standard error using 100 bootstrapped samples boot(x, meanFunc, 100) Bootstrap Statistics: original bias std. error t1* 21.5 0.254 2.379263
تُظهر القيمة “الأصلية” البالغة 21.5 متوسط مجموعة البيانات الأصلية. الأمراض المنقولة جنسيا. تشير قيمة 2.379263 إلى الخطأ القياسي للوسط.
لاحظ أننا استخدمنا 100 عينة تمهيدية لتقدير الخطأ المعياري للوسط في هذا المثال، ولكن كان بإمكاننا استخدام 1000 أو 10000 أو أي عدد من العينات التمهيدية التي أردناها.
الطريقة الثانية: اكتب الصيغة الخاصة بك
هناك طريقة أخرى لحساب خطأ تمهيدي قياسي وهي كتابة دالتنا الخاصة.
يوضح الكود التالي كيفية القيام بذلك:
#make this example reproducible set. seeds (10) #load boot library library (boot) #define dataset x <- c(12, 14, 14, 15, 18, 21, 25, 29, 32, 35) mean(replicate(100, sd( sample (x, replace= T ))/sqrt( length (x)))) [1] 2.497414
تبين أن الخطأ القياسي الذي تم تمهيده هو 2.497414 .
لاحظ أن هذا الخطأ القياسي يشبه تمامًا الخطأ المحسوب في المثال السابق.