So verwenden sie die funktion summary() in r (mit beispielen)


Die Funktion summary() in R kann verwendet werden, um Werte in einem Vektor, Datenrahmen, Regressionsmodell oder ANOVA-Modell in R schnell zusammenzufassen.

Diese Syntax verwendet die folgende grundlegende Syntax:

 summary(data)

Die folgenden Beispiele zeigen, wie Sie diese Funktion in der Praxis nutzen können.

Beispiel 1: Verwendung von summary() mit Vector

Der folgende Code zeigt, wie Sie mit der Funktion summary() Werte in einem Vektor zusammenfassen:

 #definevector
x <- c(3, 4, 4, 5, 7, 8, 9, 12, 13, 13, 15, 19, 21)

#summarize values in vector
summary(x)

   Min. 1st Qu. Median Mean 3rd Qu. Max. 
   3.00 5.00 9.00 10.23 13.00 21.00 

Die Funktion summary() berechnet automatisch die folgenden Zusammenfassungsstatistiken für den Vektor:

  • Min: der Mindestwert
  • 1. Qu: Der Wert des 1. Quartils (25. Perzentil)
  • Median: der Medianwert
  • 3. Qu: Der Wert des 3. Quartils (75. Perzentil)
  • Max: der Maximalwert

Beachten Sie, dass fehlende Werte (NA) im Vektor von der Funktion summary() bei der Berechnung der Zusammenfassungsstatistik automatisch ausgeschlossen werden:

 #definevector
x <- c(3, 4, 4, 5, 7, 8, 9, 12, 13, 13, 15, 19, 21, NA, NA)

#summarize values in vector
summary(x)

   Min. 1st Qu. Median Mean 3rd Qu. Max. NA's 
   3.00 5.00 9.00 10.23 13.00 21.00 2

Beispiel 2: Verwendung von summary() mit Data Frame

Der folgende Code zeigt, wie Sie mit der Funktion summary() jede Spalte in einem Datenrahmen zusammenfassen:

 #define data frame
df <- data. frame (team=c('A', 'B', 'C', 'D', 'E'),
                 points=c(99, 90, 86, 88, 95),
                 assists=c(33, 28, 31, 39, 34),
                 rebounds=c(30, 28, 24, 24, 28))

#summarize every column in data frame
summary(df)

     team points assists rebounds   
 Length:5 Min. :86.0 Min. :28 Min. :24.0  
 Class:character 1st Qu.:88.0 1st Qu.:31 1st Qu.:24.0  
 Mode:character Median:90.0 Median:33 Median:28.0  
                    Mean:91.6 Mean:33 Mean:26.8  
                    3rd Qu.:95.0 3rd Qu.:34 3rd Qu.:28.0  
                    Max. :99.0 Max. :39 Max. :30.0 

Beispiel 3: Verwendung von summary() mit bestimmten Datenrahmenspalten

Der folgende Code zeigt, wie Sie die Funktion summary() verwenden, um bestimmte Spalten in einem Datenrahmen zusammenzufassen:

 #define data frame
df <- data. frame (team=c('A', 'B', 'C', 'D', 'E'),
                 points=c(99, 90, 86, 88, 95),
                 assists=c(33, 28, 31, 39, 34),
                 rebounds=c(30, 28, 24, 24, 28))

#summarize every column in data frame
summary(df[c(' points ', ' rebounds ')])

     rebound points   
 Min. :86.0 Min. :24.0  
 1st Qu.:88.0 1st Qu.:24.0  
 Median:90.0 Median:28.0  
 Mean:91.6 Mean:26.8  
 3rd Qu.:95.0 3rd Qu.:28.0  
 Max. :99.0 Max. :30.0

Beispiel 4: Verwendung von summary() mit einem Regressionsmodell

Der folgende Code zeigt, wie Sie mit der Funktion summary() die Ergebnisse eines linearen Regressionsmodells zusammenfassen:

 #define data
df <- data. frame (y=c(99, 90, 86, 88, 95, 99, 91),
                 x=c(33, 28, 31, 39, 34, 35, 36))

#fit linear regression model
model <- lm(y~x, data=df)

#summarize model fit
summary(model)

Call:
lm(formula = y ~ x, data = df)

Residuals:
     1 2 3 4 5 6 7 
 6,515 -1,879 -6,242 -5,212 2,394 6,273 -1,848 

Coefficients:
            Estimate Std. Error t value Pr(>|t|)  
(Intercept) 88.4848 22.1050 4.003 0.0103 *
x 0.1212 0.6526 0.186 0.8599  
---
Significant. codes: 0 '***' 0.001 '**' 0.01 '*' 0.05 '.' 0.1 ' ' 1

Residual standard error: 5.668 on 5 degrees of freedom
Multiple R-squared: 0.006853, Adjusted R-squared: -0.1918 
F-statistic: 0.0345 on 1 and 5 DF, p-value: 0.8599

Verwandt: So interpretieren Sie die Regressionsausgabe in R

Beispiel 5: Verwendung von summary() mit dem ANOVA-Modell

Der folgende Code zeigt, wie Sie die Funktion summary() verwenden, um die Ergebnisse eines ANOVA-Modells in R zusammenzufassen:

 #make this example reproducible
set. seeds (0)

#create data frame
data <- data. frame (program = rep (c("A", "B", "C"), each = 30 ),
                   weight_loss = c(runif(30, 0, 3),
                                   runif(30, 0, 5),
                                   runif(30, 1, 7)))

#fit ANOVA model
model <- aov(weight_loss ~ program, data = data)

#summarize model fit
summary(model)

            Df Sum Sq Mean Sq F value Pr(>F)    
program 2 98.93 49.46 30.83 7.55e-11 ***
Residuals 87 139.57 1.60                     
---
Significant. codes: 0 '***' 0.001 '**' 0.01 '*' 0.05 '.' 0.1 ' ' 1

Verwandt: So interpretieren Sie ANOVA-Ergebnisse in R

Zusätzliche Ressourcen

Die folgenden Tutorials bieten weitere Informationen zur Berechnung zusammenfassender Statistiken in R:

So berechnen Sie die Zusammenfassung von fünf Zahlen in R
Der einfachste Weg, Übersichtstabellen in R zu erstellen
So erstellen Sie relative Häufigkeitstabellen in R

Einen Kommentar hinzufügen

Deine E-Mail-Adresse wird nicht veröffentlicht. Erforderliche Felder sind mit * markiert