كيفية حساب الخطأ المعياري للمتوسط في بايثون

By دكتور بنيامين أندرسون قويروق‏دوغان 27, 2023 مرشد 0 Comments

الخطأ المعياري للمتوسط هو وسيلة لقياس توزيع القيم في مجموعة البيانات. يتم حسابه على النحو التالي:

الخطأ المعياري للوسط = s / √n

ذهب:

s : عينة الانحراف المعياري
ن : حجم العينة

يشرح هذا البرنامج التعليمي طريقتين يمكنك استخدامهما لحساب الخطأ القياسي لمتوسط مجموعة بيانات في بايثون. لاحظ أن كلتا الطريقتين تنتجان نفس النتائج تمامًا.

الطريقة الأولى: استخدم SciPy

الطريقة الأولى لحساب الخطأ المعياري للمتوسط هي استخدام الدالة sem() من مكتبة SciPy Stats.

يوضح الكود التالي كيفية استخدام هذه الوظيفة:

 from scipy. stats import week

#define dataset 
data = [3, 4, 4, 5, 7, 8, 12, 14, 14, 15, 17, 19, 22, 24, 24, 24, 25, 28, 28, 29]

#calculate standard error of the mean 
sem(data)

2.001447

الخطأ المعياري للوسط هو 2.001447 .

الطريقة الثانية: استخدم NumPy

هناك طريقة أخرى لحساب الخطأ القياسي لمتوسط مجموعة بيانات وهي استخدام الدالة std() الخاصة بـ NumPy.

لاحظ أننا بحاجة إلى تحديد ddof=1 في وسيطة هذه الدالة لحساب نموذج الانحراف المعياري بدلاً من الانحراف المعياري للسكان.

يوضح الكود التالي كيفية القيام بذلك:

 import numpy as np

#define dataset
data = np.array([3, 4, 4, 5, 7, 8, 12, 14, 14, 15, 17, 19, 22, 24, 24, 24, 25, 28, 28, 29])

#calculate standard error of the mean 
n.p. std (data, ddof= 1 ) / np. sqrt ( np.size (data))

2.001447

مرة أخرى، الخطأ المعياري للوسط هو 2.001447 .

كيفية تفسير الخطأ المعياري للمتوسط

الخطأ المعياري للوسط هو ببساطة مقياس لانتشار القيم حول المتوسط. هناك أمران يجب مراعاتهما عند تفسير الخطأ المعياري للمتوسط:

1. كلما زاد الخطأ المعياري للمتوسط، زادت تشتت القيم حول المتوسط في مجموعة البيانات.

لتوضيح ذلك، فكر فيما إذا قمنا بتغيير القيمة الأخيرة لمجموعة البيانات السابقة برقم أكبر بكثير:

 from scipy. stats import week

#define dataset 
data = [3, 4, 4, 5, 7, 8, 12, 14, 14, 15, 17, 19, 22, 24, 24, 24, 25, 28, 28, 150 ]

#calculate standard error of the mean 
sem(data)

6.978265

لاحظ كيف يزداد الخطأ القياسي من 2.001447 إلى 6.978265 . يشير هذا إلى أن القيم الموجودة في مجموعة البيانات هذه موزعة بشكل أكبر حول المتوسط مقارنة بمجموعة البيانات السابقة.

2. مع زيادة حجم العينة، يميل الخطأ المعياري للمتوسط إلى الانخفاض.

لتوضيح ذلك، ضع في اعتبارك الخطأ المعياري للمتوسط لمجموعتي البيانات التاليتين:

 from scipy . stats import week 

#define first dataset and find SEM
data1 = [1, 2, 3, 4, 5]
sem(data1)

0.7071068

#define second dataset and find SEM
data2 = [1, 2, 3, 4, 5, 1, 2, 3, 4, 5]
sem(data2)

0.4714045

مجموعة البيانات الثانية هي ببساطة مجموعة البيانات الأولى التي تتكرر مرتين. لذا فإن كلا مجموعتي البيانات لهما نفس المتوسط، لكن مجموعة البيانات الثانية لها حجم عينة أكبر، وبالتالي بها خطأ معياري أصغر.

مصادر إضافية

كيفية حساب الخطأ المعياري للوسط في R
كيفية حساب الخطأ المعياري للمتوسط في Excel
كيفية حساب الخطأ المعياري للمتوسط في جداول بيانات Google

About Author

دكتور بنيامين أندرسون

مرحبًا، أنا بنجامين، أستاذ الإحصاء المتقاعد الذي تحول إلى مدرس متخصص في Statorials. بفضل خبرتي الواسعة في مجال الإحصاء، فأنا حريص على مشاركة معرفتي لتمكين الطلاب من خلال Statorials. تعرف أكثر