आर में सारांश () फ़ंक्शन का उपयोग कैसे करें (उदाहरण के साथ)


R में सारांश() फ़ंक्शन का उपयोग R में वेक्टर, डेटा फ़्रेम, रिग्रेशन मॉडल या ANOVA मॉडल में मानों को त्वरित रूप से सारांशित करने के लिए किया जा सकता है।

यह सिंटैक्स निम्नलिखित मूल सिंटैक्स का उपयोग करता है:

 summary(data)

निम्नलिखित उदाहरण दिखाते हैं कि व्यवहार में इस फ़ंक्शन का उपयोग कैसे करें।

उदाहरण 1: वेक्टर के साथ सारांश() का उपयोग करना

निम्नलिखित कोड दिखाता है कि वेक्टर में मानों को सारांशित करने के लिए सारांश() फ़ंक्शन का उपयोग कैसे करें:

 #definevector
x <- c(3, 4, 4, 5, 7, 8, 9, 12, 13, 13, 15, 19, 21)

#summarize values in vector
summary(x)

   Min. 1st Qu. Median Mean 3rd Qu. Max. 
   3.00 5.00 9.00 10.23 13.00 21.00 

सारांश() फ़ंक्शन स्वचालित रूप से वेक्टर के लिए निम्नलिखित सारांश आंकड़ों की गणना करता है:

  • न्यूनतम: न्यूनतम मान
  • प्रथम Qu: प्रथम चतुर्थक का मान (25वाँ प्रतिशतक)
  • माध्यिका: माध्यिका मान
  • तीसरा Qu: तीसरे चतुर्थक का मान (75वाँ प्रतिशतक)
  • अधिकतम: अधिकतम मान

ध्यान दें कि यदि वेक्टर में गुम मान (एनए) हैं, तो सारांश आंकड़ों की गणना करते समय सारांश() फ़ंक्शन स्वचालित रूप से उन्हें बाहर कर देगा:

 #definevector
x <- c(3, 4, 4, 5, 7, 8, 9, 12, 13, 13, 15, 19, 21, NA, NA)

#summarize values in vector
summary(x)

   Min. 1st Qu. Median Mean 3rd Qu. Max. NA's 
   3.00 5.00 9.00 10.23 13.00 21.00 2

उदाहरण 2: डेटा फ़्रेम के साथ सारांश() का उपयोग करना

निम्नलिखित कोड दिखाता है कि डेटा फ्रेम में प्रत्येक कॉलम को सारांशित करने के लिए सारांश() फ़ंक्शन का उपयोग कैसे करें:

 #define data frame
df <- data. frame (team=c('A', 'B', 'C', 'D', 'E'),
                 points=c(99, 90, 86, 88, 95),
                 assists=c(33, 28, 31, 39, 34),
                 rebounds=c(30, 28, 24, 24, 28))

#summarize every column in data frame
summary(df)

     team points assists rebounds   
 Length:5 Min. :86.0 Min. :28 Min. :24.0  
 Class:character 1st Qu.:88.0 1st Qu.:31 1st Qu.:24.0  
 Mode:character Median:90.0 Median:33 Median:28.0  
                    Mean:91.6 Mean:33 Mean:26.8  
                    3rd Qu.:95.0 3rd Qu.:34 3rd Qu.:28.0  
                    Max. :99.0 Max. :39 Max. :30.0 

उदाहरण 3: विशिष्ट डेटा फ़्रेम कॉलम के साथ सारांश() का उपयोग करना

निम्नलिखित कोड दिखाता है कि डेटा फ़्रेम में विशिष्ट कॉलम को सारांशित करने के लिए सारांश() फ़ंक्शन का उपयोग कैसे करें:

 #define data frame
df <- data. frame (team=c('A', 'B', 'C', 'D', 'E'),
                 points=c(99, 90, 86, 88, 95),
                 assists=c(33, 28, 31, 39, 34),
                 rebounds=c(30, 28, 24, 24, 28))

#summarize every column in data frame
summary(df[c(' points ', ' rebounds ')])

     rebound points   
 Min. :86.0 Min. :24.0  
 1st Qu.:88.0 1st Qu.:24.0  
 Median:90.0 Median:28.0  
 Mean:91.6 Mean:26.8  
 3rd Qu.:95.0 3rd Qu.:28.0  
 Max. :99.0 Max. :30.0

उदाहरण 4: प्रतिगमन मॉडल के साथ सारांश() का उपयोग करना

निम्नलिखित कोड दिखाता है कि रैखिक प्रतिगमन मॉडल के परिणामों को सारांशित करने के लिए सारांश() फ़ंक्शन का उपयोग कैसे करें:

 #define data
df <- data. frame (y=c(99, 90, 86, 88, 95, 99, 91),
                 x=c(33, 28, 31, 39, 34, 35, 36))

#fit linear regression model
model <- lm(y~x, data=df)

#summarize model fit
summary(model)

Call:
lm(formula = y ~ x, data = df)

Residuals:
     1 2 3 4 5 6 7 
 6,515 -1,879 -6,242 -5,212 2,394 6,273 -1,848 

Coefficients:
            Estimate Std. Error t value Pr(>|t|)  
(Intercept) 88.4848 22.1050 4.003 0.0103 *
x 0.1212 0.6526 0.186 0.8599  
---
Significant. codes: 0 '***' 0.001 '**' 0.01 '*' 0.05 '.' 0.1 ' ' 1

Residual standard error: 5.668 on 5 degrees of freedom
Multiple R-squared: 0.006853, Adjusted R-squared: -0.1918 
F-statistic: 0.0345 on 1 and 5 DF, p-value: 0.8599

संबंधित: आर में प्रतिगमन आउटपुट की व्याख्या कैसे करें

उदाहरण 5: एनोवा मॉडल के साथ सारांश() का उपयोग करना

निम्नलिखित कोड दिखाता है कि आर में एनोवा मॉडल के परिणामों को सारांशित करने के लिए सारांश() फ़ंक्शन का उपयोग कैसे करें:

 #make this example reproducible
set. seeds (0)

#create data frame
data <- data. frame (program = rep (c("A", "B", "C"), each = 30 ),
                   weight_loss = c(runif(30, 0, 3),
                                   runif(30, 0, 5),
                                   runif(30, 1, 7)))

#fit ANOVA model
model <- aov(weight_loss ~ program, data = data)

#summarize model fit
summary(model)

            Df Sum Sq Mean Sq F value Pr(>F)    
program 2 98.93 49.46 30.83 7.55e-11 ***
Residuals 87 139.57 1.60                     
---
Significant. codes: 0 '***' 0.001 '**' 0.01 '*' 0.05 '.' 0.1 ' ' 1

संबंधित: आर में एनोवा परिणामों की व्याख्या कैसे करें

अतिरिक्त संसाधन

निम्नलिखित ट्यूटोरियल आर में सारांश आंकड़ों की गणना के बारे में अधिक जानकारी प्रदान करते हैं:

आर में पांच संख्याओं के सारांश की गणना कैसे करें
आर में सारांश तालिकाएँ बनाने का सबसे आसान तरीका
आर में सापेक्ष आवृत्ति तालिकाएँ कैसे बनाएं

एक टिप्पणी जोड़ने

आपका ईमेल पता प्रकाशित नहीं किया जाएगा. आवश्यक फ़ील्ड चिह्नित हैं *