आर में सारांश तालिकाएँ बनाने का सबसे आसान तरीका


आर में सारांश तालिकाएँ बनाने का सबसे आसान तरीका साइक लाइब्रेरी से डिस्क्रिप्शन() और डिस्क्रिप्शनबाय() फ़ंक्शंस का उपयोग करना है।

 library (psych)

#create summary table
describe(df)

#create summary table, grouped by a specific variable
describeBy(df, group=df$var_name)

निम्नलिखित उदाहरण दिखाते हैं कि व्यवहार में इन कार्यों का उपयोग कैसे करें।

उदाहरण 1: एक बुनियादी सारांश तालिका बनाएँ

मान लीजिए कि हमारे पास R में निम्नलिखित डेटा फ़्रेम है:

 #create data frame
df <- data. frame (team=c('A', 'A', 'B', 'B', 'C', 'C', 'C'),
                 points=c(15, 22, 29, 41, 30, 11, 19),
                 rebounds=c(7, 8, 6, 6, 7, 9, 13),
                 steals=c(1, 1, 2, 3, 5, 7, 5))

#view data frame
df

  team points rebounds steals
1 to 15 7 1
2 A 22 8 1
3 B 29 6 2
4 B 41 6 3
5 C 30 7 5
6 C 11 9 7
7 C 19 13 5

हम डेटा फ़्रेम में प्रत्येक चर के लिए सारांश तालिका बनाने के लिए वर्णन() फ़ंक्शन का उपयोग कर सकते हैं:

 library (psych)

#create summary table
describe(df)

         vars n mean sd median trimmed mad min max range skew kurtosis
team* 1 7 2.14 0.90 2 2.14 1.48 1 3 2 -0.22 -1.90
points 2 7 23.86 10.24 22 23.86 10.38 11 41 30 0.33 -1.41
rebounds 3 7 8.00 2.45 7 8.00 1.48 6 13 7 1.05 -0.38
steals 4 7 3.43 2.30 3 3.43 2.97 1 7 6 0.25 -1.73
           se
team* 0.34
points 3.87
rebounds 0.93
steals 0.87

परिणाम में प्रत्येक मान की व्याख्या करने का तरीका यहां बताया गया है:

  • वर् : कॉलम संख्या
  • n : वैध मामलों की संख्या
  • औसत : औसत मूल्य
  • माध्यिका : माध्यिका मान
  • ट्रिम किया गया : ट्रिम किया गया माध्य (डिफ़ॉल्ट रूप से, प्रत्येक छोर पर 10% अवलोकन हटा दिए जाते हैं)
  • पागल : पूर्ण माध्यिका विचलन (माध्यिका से)
  • न्यूनतम : न्यूनतम मान
  • अधिकतम : अधिकतम मान
  • सीमा : मानों की सीमा (अधिकतम – न्यूनतम)
  • तिरछा : विषमता
  • कुर्टोसिस : चपटा होना
  • से : मानक त्रुटि

यह ध्यान रखना महत्वपूर्ण है कि तारक (*) वाला कोई भी चर एक श्रेणीबद्ध या तार्किक चर है जिसे मूल्यों के साथ एक संख्यात्मक चर में परिवर्तित किया गया है जो मूल्यों के संख्यात्मक क्रम का प्रतिनिधित्व करता है।

हमारे उदाहरण में, “टीम” चर को एक संख्यात्मक चर में बदल दिया गया है, इसलिए हमें संबंधित सारांश आँकड़ों की शाब्दिक व्याख्या नहीं करनी चाहिए।

यह भी ध्यान दें कि आप केवल सबसे सामान्य सारांश आँकड़ों की गणना करने के लिए fast=TRUE तर्क का उपयोग कर सकते हैं:

 #create smaller summary table
describe(df, fast= TRUE )

         vars n mean sd min max range se
team 1 7 NaN NA Inf -Inf -Inf NA
points 2 7 23.86 10.24 11 41 30 3.87
rebounds 3 7 8.00 2.45 6 13 7 0.93
steals 4 7 3.43 2.30 1 7 6 0.87

हम डेटा फ़्रेम में केवल कुछ चर के लिए सारांश आंकड़ों की गणना करना भी चुन सकते हैं:

 #create summary table for just 'points' and 'rebounds' columns
describe(df[, c(' points ', ' rebounds ')], fast= TRUE )

         vars n mean sd min max range se
points 1 7 23.86 10.24 11 41 30 3.87
rebounds 2 7 8.00 2.45 6 13 7 0.93

उदाहरण 2: विशिष्ट चर द्वारा समूहीकृत एक सारांश तालिका बनाएं

निम्नलिखित कोड दिखाता है कि “टीम” वेरिएबल द्वारा समूहीकृत डेटा फ्रेम के लिए सारांश तालिका बनाने के लिए डिस्क्रिप्शनबाय() फ़ंक्शन का उपयोग कैसे करें:

 #create summary table, grouped by 'team' variable
describeBy(df, group=df$team, fast= TRUE )

 Descriptive statistics by group 
group: A
         vars n mean sd min max range se
team 1 2 NaN NA Inf -Inf -Inf NA
points 2 2 18.5 4.95 15 22 7 3.5
rebounds 3 2 7.5 0.71 7 8 1 0.5
steals 4 2 1.0 0.00 1 1 0 0.0
-------------------------------------------------- ---------- 
group: B
         vars n mean sd min max range se
team 1 2 NaN NA Inf -Inf -Inf NA
points 2 2 35.0 8.49 29 41 12 6.0
rebounds 3 2 6.0 0.00 6 6 0 0.0
steals 4 2 2.5 0.71 2 3 1 0.5
-------------------------------------------------- ---------- 
group: C
         vars n mean sd min max range se
team 1 3 NaN NA Inf -Inf -Inf NA
points 2 3 20.00 9.54 11 30 19 5.51
rebounds 3 3 9.67 3.06 7 13 6 1.76
steals 4 3 5.67 1.15 5 7 2 0.67

आउटपुट डेटा फ़्रेम में प्रत्येक तीन टीमों के लिए सारांश आँकड़े प्रदर्शित करता है।

अतिरिक्त संसाधन

आर में पांच संख्याओं के सारांश की गणना कैसे करें
आर में प्रति समूह माध्य की गणना कैसे करें
आर में समूह द्वारा योग की गणना कैसे करें
आर में विचरण की गणना कैसे करें
आर में सहप्रसरण मैट्रिक्स कैसे बनाएं

एक टिप्पणी जोड़ने

आपका ईमेल पता प्रकाशित नहीं किया जाएगा. आवश्यक फ़ील्ड चिह्नित हैं *