आर में माध्य की मानक त्रुटि की गणना कैसे करें
माध्य की मानक त्रुटि डेटा सेट में मूल्यों के वितरण को मापने का एक तरीका है। इसकी गणना इस प्रकार की जाती है:
मानक त्रुटि = s / √n
सोना:
- s : नमूना मानक विचलन
- n : नमूना आकार
यह ट्यूटोरियल दो तरीकों की व्याख्या करता है जिनका उपयोग आप आर में डेटा सेट की मानक त्रुटि की गणना करने के लिए कर सकते हैं।
विधि 1: प्लॉट्रिक्स लाइब्रेरी का उपयोग करें
माध्य की मानक त्रुटि की गणना करने का पहला तरीका प्लॉट्रिक्स लाइब्रेरी के अंतर्निहित std.error() फ़ंक्शन का उपयोग करना है।
निम्नलिखित कोड दिखाता है कि इस फ़ंक्शन का उपयोग कैसे करें:
library (plotrix) #define dataset data <- c(3, 4, 4, 5, 7, 8, 12, 14, 14, 15, 17, 19, 22, 24, 24, 24, 25, 28, 28, 29) #calculate standard error of the mean std.error(data) 2.001447
माध्य की मानक त्रुटि 2.001447 निकली।
विधि 2: अपना स्वयं का कार्य परिभाषित करें
डेटा सेट के माध्य की मानक त्रुटि की गणना करने का दूसरा तरीका बस अपने स्वयं के फ़ंक्शन को परिभाषित करना है।
निम्नलिखित कोड दिखाता है कि यह कैसे करना है:
#define standard error of mean function std.error <- function (x) sd(x)/sqrt( length (x)) #define dataset data <- c(3, 4, 4, 5, 7, 8, 12, 14, 14, 15, 17, 19, 22, 24, 24, 24, 25, 28, 28, 29) #calculate standard error of the mean std.error(data) 2.001447
फिर, माध्य की मानक त्रुटि 2.0014 निकली।
माध्य की मानक त्रुटि की व्याख्या कैसे करें
माध्य की मानक त्रुटि माध्य के चारों ओर मूल्यों के प्रसार का एक माप मात्र है।
माध्य की मानक त्रुटि की व्याख्या करते समय दो बातें ध्यान में रखनी चाहिए:
1. माध्य की मानक त्रुटि जितनी बड़ी होगी, डेटा सेट में माध्य के आसपास मान उतने ही अधिक बिखरे हुए होंगे।
इसे स्पष्ट करने के लिए, विचार करें कि क्या हम पिछले डेटासेट के अंतिम मान को बहुत बड़ी संख्या से बदलते हैं:
#define dataset data <- c(3, 4, 4, 5, 7, 8, 12, 14, 14, 15, 17, 19, 22, 24, 24, 24, 25, 28, 28, 150) #calculate standard error of the mean std.error(data) 6.978265
ध्यान दें कि मानक त्रुटि 2.001447 से बढ़कर 6.978265 कैसे हो जाती है।
यह इंगित करता है कि इस डेटासेट में मान पिछले डेटासेट की तुलना में माध्य के आसपास अधिक वितरित हैं।
2. जैसे-जैसे नमूना आकार बढ़ता है, माध्य की मानक त्रुटि कम होती जाती है।
इसे स्पष्ट करने के लिए, डेटा के निम्नलिखित दो सेटों के लिए माध्य की मानक त्रुटि पर विचार करें:
#define first dataset and find SEM data1 <- c(1, 2, 3, 4, 5) std.error(data1) 0.7071068 #define second dataset and find SEM data2 <- c(1, 2, 3, 4, 5, 1, 2, 3, 4, 5) std.error(data2) 0.4714045
दूसरा डेटा सेट केवल पहला डेटा सेट है जिसे दो बार दोहराया गया है।
इसलिए दोनों डेटा सेट का माध्य समान है लेकिन दूसरे डेटा सेट का नमूना आकार बड़ा है और इसलिए इसमें छोटी मानक त्रुटि है।
अतिरिक्त संसाधन
निम्नलिखित ट्यूटोरियल बताते हैं कि आर में अन्य सामान्य कार्य कैसे करें:
आर में नमूना और जनसंख्या भिन्नता की गणना कैसे करें
आर में पूलित विचरण की गणना कैसे करें
R की भिन्नता के गुणांक की गणना कैसे करें