كيفية حساب الخطأ المعياري للوسط في r
الخطأ المعياري للمتوسط هو وسيلة لقياس توزيع القيم في مجموعة البيانات. يتم حسابه على النحو التالي:
الخطأ المعياري = s / √n
ذهب:
- s : عينة الانحراف المعياري
- ن : حجم العينة
يشرح هذا البرنامج التعليمي طريقتين يمكنك استخدامهما لحساب الخطأ القياسي لمجموعة بيانات في R.
الطريقة الأولى: استخدام مكتبة بلوتريكس
الطريقة الأولى لحساب الخطأ المعياري للمتوسط هي استخدام وظيفة std.error() المضمنة في مكتبة بلوتريكس.
يوضح الكود التالي كيفية استخدام هذه الوظيفة:
library (plotrix) #define dataset data <- c(3, 4, 4, 5, 7, 8, 12, 14, 14, 15, 17, 19, 22, 24, 24, 24, 25, 28, 28, 29) #calculate standard error of the mean std.error(data) 2.001447
الخطأ المعياري للوسط هو 2.001447 .
الطريقة الثانية: تحديد وظيفتك الخاصة
هناك طريقة أخرى لحساب الخطأ المعياري لمتوسط مجموعة بيانات وهي ببساطة تحديد وظيفتك الخاصة.
يوضح الكود التالي كيفية القيام بذلك:
#define standard error of mean function std.error <- function (x) sd(x)/sqrt( length (x)) #define dataset data <- c(3, 4, 4, 5, 7, 8, 12, 14, 14, 15, 17, 19, 22, 24, 24, 24, 25, 28, 28, 29) #calculate standard error of the mean std.error(data) 2.001447
مرة أخرى، الخطأ المعياري للوسط هو 2.0014 .
كيفية تفسير الخطأ المعياري للمتوسط
الخطأ المعياري للوسط هو ببساطة مقياس لانتشار القيم حول المتوسط.
هناك أمران يجب مراعاتهما عند تفسير الخطأ المعياري للمتوسط:
1. كلما زاد الخطأ المعياري للمتوسط، زادت تشتت القيم حول المتوسط في مجموعة البيانات.
لتوضيح ذلك، فكر فيما إذا قمنا بتغيير القيمة الأخيرة لمجموعة البيانات السابقة برقم أكبر بكثير:
#define dataset data <- c(3, 4, 4, 5, 7, 8, 12, 14, 14, 15, 17, 19, 22, 24, 24, 24, 25, 28, 28, 150) #calculate standard error of the mean std.error(data) 6.978265
لاحظ كيف يزداد الخطأ القياسي من 2.001447 إلى 6.978265 .
يشير هذا إلى أن القيم الموجودة في مجموعة البيانات هذه موزعة بشكل أكبر حول المتوسط مقارنة بمجموعة البيانات السابقة.
2. مع زيادة حجم العينة، يميل الخطأ المعياري للمتوسط إلى الانخفاض.
لتوضيح ذلك، ضع في اعتبارك الخطأ المعياري للمتوسط لمجموعتي البيانات التاليتين:
#define first dataset and find SEM data1 <- c(1, 2, 3, 4, 5) std.error(data1) 0.7071068 #define second dataset and find SEM data2 <- c(1, 2, 3, 4, 5, 1, 2, 3, 4, 5) std.error(data2) 0.4714045
مجموعة البيانات الثانية هي ببساطة مجموعة البيانات الأولى التي تتكرر مرتين.
لذا فإن كلا مجموعتي البيانات لهما نفس المتوسط، لكن مجموعة البيانات الثانية لها حجم عينة أكبر، وبالتالي بها خطأ معياري أصغر.
مصادر إضافية
تشرح البرامج التعليمية التالية كيفية تنفيذ المهام الشائعة الأخرى في R:
كيفية حساب تباين العينة والسكان في R
كيفية حساب التباين المجمع في R
كيفية حساب معامل الاختلاف لـ R