आर में माध्य की मानक त्रुटि की गणना कैसे करें


माध्य की मानक त्रुटि डेटा सेट में मूल्यों के वितरण को मापने का एक तरीका है। इसकी गणना इस प्रकार की जाती है:

मानक त्रुटि = s / √n

सोना:

  • s : नमूना मानक विचलन
  • n : नमूना आकार

यह ट्यूटोरियल दो तरीकों की व्याख्या करता है जिनका उपयोग आप आर में डेटा सेट की मानक त्रुटि की गणना करने के लिए कर सकते हैं।

विधि 1: प्लॉट्रिक्स लाइब्रेरी का उपयोग करें

माध्य की मानक त्रुटि की गणना करने का पहला तरीका प्लॉट्रिक्स लाइब्रेरी के अंतर्निहित std.error() फ़ंक्शन का उपयोग करना है।

निम्नलिखित कोड दिखाता है कि इस फ़ंक्शन का उपयोग कैसे करें:

 library (plotrix)

#define dataset
data <- c(3, 4, 4, 5, 7, 8, 12, 14, 14, 15, 17, 19, 22, 24, 24, 24, 25, 28, 28, 29)

#calculate standard error of the mean 
std.error(data)

2.001447

माध्य की मानक त्रुटि 2.001447 निकली।

विधि 2: अपना स्वयं का कार्य परिभाषित करें

डेटा सेट के माध्य की मानक त्रुटि की गणना करने का दूसरा तरीका बस अपने स्वयं के फ़ंक्शन को परिभाषित करना है।

निम्नलिखित कोड दिखाता है कि यह कैसे करना है:

 #define standard error of mean function
std.error <- function (x) sd(x)/sqrt( length (x))

#define dataset
data <- c(3, 4, 4, 5, 7, 8, 12, 14, 14, 15, 17, 19, 22, 24, 24, 24, 25, 28, 28, 29)

#calculate standard error of the mean 
std.error(data)

2.001447

फिर, माध्य की मानक त्रुटि 2.0014 निकली।

माध्य की मानक त्रुटि की व्याख्या कैसे करें

माध्य की मानक त्रुटि माध्य के चारों ओर मूल्यों के प्रसार का एक माप मात्र है।

माध्य की मानक त्रुटि की व्याख्या करते समय दो बातें ध्यान में रखनी चाहिए:

1. माध्य की मानक त्रुटि जितनी बड़ी होगी, डेटा सेट में माध्य के आसपास मान उतने ही अधिक बिखरे हुए होंगे।

इसे स्पष्ट करने के लिए, विचार करें कि क्या हम पिछले डेटासेट के अंतिम मान को बहुत बड़ी संख्या से बदलते हैं:

 #define dataset
data <- c(3, 4, 4, 5, 7, 8, 12, 14, 14, 15, 17, 19, 22, 24, 24, 24, 25, 28, 28, 150)

#calculate standard error of the mean 
std.error(data)

6.978265

ध्यान दें कि मानक त्रुटि 2.001447 से बढ़कर 6.978265 कैसे हो जाती है।

यह इंगित करता है कि इस डेटासेट में मान पिछले डेटासेट की तुलना में माध्य के आसपास अधिक वितरित हैं।

2. जैसे-जैसे नमूना आकार बढ़ता है, माध्य की मानक त्रुटि कम होती जाती है।

इसे स्पष्ट करने के लिए, डेटा के निम्नलिखित दो सेटों के लिए माध्य की मानक त्रुटि पर विचार करें:

 #define first dataset and find SEM
data1 <- c(1, 2, 3, 4, 5)
std.error(data1)

0.7071068

#define second dataset and find SEM
data2 <- c(1, 2, 3, 4, 5, 1, 2, 3, 4, 5)
std.error(data2)

0.4714045

दूसरा डेटा सेट केवल पहला डेटा सेट है जिसे दो बार दोहराया गया है।

इसलिए दोनों डेटा सेट का माध्य समान है लेकिन दूसरे डेटा सेट का नमूना आकार बड़ा है और इसलिए इसमें छोटी मानक त्रुटि है।

अतिरिक्त संसाधन

निम्नलिखित ट्यूटोरियल बताते हैं कि आर में अन्य सामान्य कार्य कैसे करें:

आर में नमूना और जनसंख्या भिन्नता की गणना कैसे करें
आर में पूलित विचरण की गणना कैसे करें
R की भिन्नता के गुणांक की गणना कैसे करें

एक टिप्पणी जोड़ने

आपका ईमेल पता प्रकाशित नहीं किया जाएगा. आवश्यक फ़ील्ड चिह्नित हैं *