كيفية حساب الخطأ المعياري للمتوسط في بايثون
الخطأ المعياري للمتوسط هو وسيلة لقياس توزيع القيم في مجموعة البيانات. يتم حسابه على النحو التالي:
الخطأ المعياري للوسط = s / √n
ذهب:
- s : عينة الانحراف المعياري
- ن : حجم العينة
يشرح هذا البرنامج التعليمي طريقتين يمكنك استخدامهما لحساب الخطأ القياسي لمتوسط مجموعة بيانات في بايثون. لاحظ أن كلتا الطريقتين تنتجان نفس النتائج تمامًا.
الطريقة الأولى: استخدم SciPy
الطريقة الأولى لحساب الخطأ المعياري للمتوسط هي استخدام الدالة sem() من مكتبة SciPy Stats.
يوضح الكود التالي كيفية استخدام هذه الوظيفة:
from scipy. stats import week #define dataset data = [3, 4, 4, 5, 7, 8, 12, 14, 14, 15, 17, 19, 22, 24, 24, 24, 25, 28, 28, 29] #calculate standard error of the mean sem(data) 2.001447
الخطأ المعياري للوسط هو 2.001447 .
الطريقة الثانية: استخدم NumPy
هناك طريقة أخرى لحساب الخطأ القياسي لمتوسط مجموعة بيانات وهي استخدام الدالة std() الخاصة بـ NumPy.
لاحظ أننا بحاجة إلى تحديد ddof=1 في وسيطة هذه الدالة لحساب نموذج الانحراف المعياري بدلاً من الانحراف المعياري للسكان.
يوضح الكود التالي كيفية القيام بذلك:
import numpy as np #define dataset data = np.array([3, 4, 4, 5, 7, 8, 12, 14, 14, 15, 17, 19, 22, 24, 24, 24, 25, 28, 28, 29]) #calculate standard error of the mean n.p. std (data, ddof= 1 ) / np. sqrt ( np.size (data)) 2.001447
مرة أخرى، الخطأ المعياري للوسط هو 2.001447 .
كيفية تفسير الخطأ المعياري للمتوسط
الخطأ المعياري للوسط هو ببساطة مقياس لانتشار القيم حول المتوسط. هناك أمران يجب مراعاتهما عند تفسير الخطأ المعياري للمتوسط:
1. كلما زاد الخطأ المعياري للمتوسط، زادت تشتت القيم حول المتوسط في مجموعة البيانات.
لتوضيح ذلك، فكر فيما إذا قمنا بتغيير القيمة الأخيرة لمجموعة البيانات السابقة برقم أكبر بكثير:
from scipy. stats import week #define dataset data = [3, 4, 4, 5, 7, 8, 12, 14, 14, 15, 17, 19, 22, 24, 24, 24, 25, 28, 28, 150 ] #calculate standard error of the mean sem(data) 6.978265
لاحظ كيف يزداد الخطأ القياسي من 2.001447 إلى 6.978265 . يشير هذا إلى أن القيم الموجودة في مجموعة البيانات هذه موزعة بشكل أكبر حول المتوسط مقارنة بمجموعة البيانات السابقة.
2. مع زيادة حجم العينة، يميل الخطأ المعياري للمتوسط إلى الانخفاض.
لتوضيح ذلك، ضع في اعتبارك الخطأ المعياري للمتوسط لمجموعتي البيانات التاليتين:
from scipy . stats import week #define first dataset and find SEM data1 = [1, 2, 3, 4, 5] sem(data1) 0.7071068 #define second dataset and find SEM data2 = [1, 2, 3, 4, 5, 1, 2, 3, 4, 5] sem(data2) 0.4714045
مجموعة البيانات الثانية هي ببساطة مجموعة البيانات الأولى التي تتكرر مرتين. لذا فإن كلا مجموعتي البيانات لهما نفس المتوسط، لكن مجموعة البيانات الثانية لها حجم عينة أكبر، وبالتالي بها خطأ معياري أصغر.
مصادر إضافية
كيفية حساب الخطأ المعياري للوسط في R
كيفية حساب الخطأ المعياري للمتوسط في Excel
كيفية حساب الخطأ المعياري للمتوسط في جداول بيانات Google