आर में सारांश तालिकाएँ बनाने का सबसे आसान तरीका
आर में सारांश तालिकाएँ बनाने का सबसे आसान तरीका साइक लाइब्रेरी से डिस्क्रिप्शन() और डिस्क्रिप्शनबाय() फ़ंक्शंस का उपयोग करना है।
library (psych) #create summary table describe(df) #create summary table, grouped by a specific variable describeBy(df, group=df$var_name)
निम्नलिखित उदाहरण दिखाते हैं कि व्यवहार में इन कार्यों का उपयोग कैसे करें।
उदाहरण 1: एक बुनियादी सारांश तालिका बनाएँ
मान लीजिए कि हमारे पास R में निम्नलिखित डेटा फ़्रेम है:
#create data frame df <- data. frame (team=c('A', 'A', 'B', 'B', 'C', 'C', 'C'), points=c(15, 22, 29, 41, 30, 11, 19), rebounds=c(7, 8, 6, 6, 7, 9, 13), steals=c(1, 1, 2, 3, 5, 7, 5)) #view data frame df team points rebounds steals 1 to 15 7 1 2 A 22 8 1 3 B 29 6 2 4 B 41 6 3 5 C 30 7 5 6 C 11 9 7 7 C 19 13 5
हम डेटा फ़्रेम में प्रत्येक चर के लिए सारांश तालिका बनाने के लिए वर्णन() फ़ंक्शन का उपयोग कर सकते हैं:
library (psych) #create summary table describe(df) vars n mean sd median trimmed mad min max range skew kurtosis team* 1 7 2.14 0.90 2 2.14 1.48 1 3 2 -0.22 -1.90 points 2 7 23.86 10.24 22 23.86 10.38 11 41 30 0.33 -1.41 rebounds 3 7 8.00 2.45 7 8.00 1.48 6 13 7 1.05 -0.38 steals 4 7 3.43 2.30 3 3.43 2.97 1 7 6 0.25 -1.73 se team* 0.34 points 3.87 rebounds 0.93 steals 0.87
परिणाम में प्रत्येक मान की व्याख्या करने का तरीका यहां बताया गया है:
- वर् : कॉलम संख्या
- n : वैध मामलों की संख्या
- औसत : औसत मूल्य
- माध्यिका : माध्यिका मान
- ट्रिम किया गया : ट्रिम किया गया माध्य (डिफ़ॉल्ट रूप से, प्रत्येक छोर पर 10% अवलोकन हटा दिए जाते हैं)
- पागल : पूर्ण माध्यिका विचलन (माध्यिका से)
- न्यूनतम : न्यूनतम मान
- अधिकतम : अधिकतम मान
- सीमा : मानों की सीमा (अधिकतम – न्यूनतम)
- तिरछा : विषमता
- कुर्टोसिस : चपटा होना
- से : मानक त्रुटि
यह ध्यान रखना महत्वपूर्ण है कि तारक (*) वाला कोई भी चर एक श्रेणीबद्ध या तार्किक चर है जिसे मूल्यों के साथ एक संख्यात्मक चर में परिवर्तित किया गया है जो मूल्यों के संख्यात्मक क्रम का प्रतिनिधित्व करता है।
हमारे उदाहरण में, “टीम” चर को एक संख्यात्मक चर में बदल दिया गया है, इसलिए हमें संबंधित सारांश आँकड़ों की शाब्दिक व्याख्या नहीं करनी चाहिए।
यह भी ध्यान दें कि आप केवल सबसे सामान्य सारांश आँकड़ों की गणना करने के लिए fast=TRUE तर्क का उपयोग कर सकते हैं:
#create smaller summary table describe(df, fast= TRUE ) vars n mean sd min max range se team 1 7 NaN NA Inf -Inf -Inf NA points 2 7 23.86 10.24 11 41 30 3.87 rebounds 3 7 8.00 2.45 6 13 7 0.93 steals 4 7 3.43 2.30 1 7 6 0.87
हम डेटा फ़्रेम में केवल कुछ चर के लिए सारांश आंकड़ों की गणना करना भी चुन सकते हैं:
#create summary table for just 'points' and 'rebounds' columns describe(df[, c(' points ', ' rebounds ')], fast= TRUE ) vars n mean sd min max range se points 1 7 23.86 10.24 11 41 30 3.87 rebounds 2 7 8.00 2.45 6 13 7 0.93
उदाहरण 2: विशिष्ट चर द्वारा समूहीकृत एक सारांश तालिका बनाएं
निम्नलिखित कोड दिखाता है कि “टीम” वेरिएबल द्वारा समूहीकृत डेटा फ्रेम के लिए सारांश तालिका बनाने के लिए डिस्क्रिप्शनबाय() फ़ंक्शन का उपयोग कैसे करें:
#create summary table, grouped by 'team' variable describeBy(df, group=df$team, fast= TRUE ) Descriptive statistics by group group: A vars n mean sd min max range se team 1 2 NaN NA Inf -Inf -Inf NA points 2 2 18.5 4.95 15 22 7 3.5 rebounds 3 2 7.5 0.71 7 8 1 0.5 steals 4 2 1.0 0.00 1 1 0 0.0 -------------------------------------------------- ---------- group: B vars n mean sd min max range se team 1 2 NaN NA Inf -Inf -Inf NA points 2 2 35.0 8.49 29 41 12 6.0 rebounds 3 2 6.0 0.00 6 6 0 0.0 steals 4 2 2.5 0.71 2 3 1 0.5 -------------------------------------------------- ---------- group: C vars n mean sd min max range se team 1 3 NaN NA Inf -Inf -Inf NA points 2 3 20.00 9.54 11 30 19 5.51 rebounds 3 3 9.67 3.06 7 13 6 1.76 steals 4 3 5.67 1.15 5 7 2 0.67
आउटपुट डेटा फ़्रेम में प्रत्येक तीन टीमों के लिए सारांश आँकड़े प्रदर्शित करता है।
अतिरिक्त संसाधन
आर में पांच संख्याओं के सारांश की गणना कैसे करें
आर में प्रति समूह माध्य की गणना कैसे करें
आर में समूह द्वारा योग की गणना कैसे करें
आर में विचरण की गणना कैसे करें
आर में सहप्रसरण मैट्रिक्स कैसे बनाएं