วิธีใช้ฟังก์ชันสรุป () ใน r (พร้อมตัวอย่าง)
ฟังก์ชัน summary() ใน R สามารถใช้เพื่อสรุปค่าในเวกเตอร์ กรอบข้อมูล โมเดลการถดถอย หรือโมเดล ANOVA ใน R ได้อย่างรวดเร็ว
ไวยากรณ์นี้ใช้ไวยากรณ์พื้นฐานต่อไปนี้:
summary(data)
ตัวอย่างต่อไปนี้แสดงวิธีใช้ฟังก์ชันนี้ในทางปฏิบัติ
ตัวอย่างที่ 1: การใช้ summary() กับ Vector
รหัสต่อไปนี้แสดงวิธีใช้ฟังก์ชัน summary() เพื่อสรุปค่าเป็นเวกเตอร์:
#definevector x <- c(3, 4, 4, 5, 7, 8, 9, 12, 13, 13, 15, 19, 21) #summarize values in vector summary(x) Min. 1st Qu. Median Mean 3rd Qu. Max. 3.00 5.00 9.00 10.23 13.00 21.00
ฟังก์ชัน summary() จะคำนวณสถิติสรุปต่อไปนี้สำหรับเวกเตอร์:
- Min: ค่าต่ำสุด
- Qu 1: ค่าของควอไทล์ที่ 1 (เปอร์เซ็นไทล์ที่ 25)
- ค่ามัธยฐาน: ค่ามัธยฐาน
- Qu 3: ค่าของควอไทล์ที่ 3 (เปอร์เซ็นไทล์ที่ 75)
- สูงสุด: ค่าสูงสุด
โปรดทราบว่าหากมีค่าหายไป (NA) ในเวกเตอร์ ฟังก์ชัน summary() จะแยกค่าเหล่านั้นออกโดยอัตโนมัติเมื่อคำนวณสถิติสรุป:
#definevector x <- c(3, 4, 4, 5, 7, 8, 9, 12, 13, 13, 15, 19, 21, NA, NA) #summarize values in vector summary(x) Min. 1st Qu. Median Mean 3rd Qu. Max. NA's 3.00 5.00 9.00 10.23 13.00 21.00 2
ตัวอย่างที่ 2: การใช้ summary() กับ Data Frame
รหัสต่อไปนี้แสดงวิธีใช้ฟังก์ชัน summary() เพื่อสรุปแต่ละคอลัมน์ในกรอบข้อมูล:
#define data frame df <- data. frame (team=c('A', 'B', 'C', 'D', 'E'), points=c(99, 90, 86, 88, 95), assists=c(33, 28, 31, 39, 34), rebounds=c(30, 28, 24, 24, 28)) #summarize every column in data frame summary(df) team points assists rebounds Length:5 Min. :86.0 Min. :28 Min. :24.0 Class:character 1st Qu.:88.0 1st Qu.:31 1st Qu.:24.0 Mode:character Median:90.0 Median:33 Median:28.0 Mean:91.6 Mean:33 Mean:26.8 3rd Qu.:95.0 3rd Qu.:34 3rd Qu.:28.0 Max. :99.0 Max. :39 Max. :30.0
ตัวอย่างที่ 3: การใช้ summary() กับคอลัมน์กรอบข้อมูลเฉพาะ
รหัสต่อไปนี้แสดงวิธีใช้ฟังก์ชัน summary() เพื่อสรุปคอลัมน์เฉพาะในกรอบข้อมูล:
#define data frame df <- data. frame (team=c('A', 'B', 'C', 'D', 'E'), points=c(99, 90, 86, 88, 95), assists=c(33, 28, 31, 39, 34), rebounds=c(30, 28, 24, 24, 28)) #summarize every column in data frame summary(df[c(' points ', ' rebounds ')]) rebound points Min. :86.0 Min. :24.0 1st Qu.:88.0 1st Qu.:24.0 Median:90.0 Median:28.0 Mean:91.6 Mean:26.8 3rd Qu.:95.0 3rd Qu.:28.0 Max. :99.0 Max. :30.0
ตัวอย่างที่ 4: การใช้ summary() กับแบบจำลองการถดถอย
รหัสต่อไปนี้แสดงวิธีการใช้ฟังก์ชัน summary() เพื่อสรุปผลลัพธ์ของแบบจำลองการถดถอยเชิงเส้น:
#define data df <- data. frame (y=c(99, 90, 86, 88, 95, 99, 91), x=c(33, 28, 31, 39, 34, 35, 36)) #fit linear regression model model <- lm(y~x, data=df) #summarize model fit summary(model) Call: lm(formula = y ~ x, data = df) Residuals: 1 2 3 4 5 6 7 6,515 -1,879 -6,242 -5,212 2,394 6,273 -1,848 Coefficients: Estimate Std. Error t value Pr(>|t|) (Intercept) 88.4848 22.1050 4.003 0.0103 * x 0.1212 0.6526 0.186 0.8599 --- Significant. codes: 0 '***' 0.001 '**' 0.01 '*' 0.05 '.' 0.1 ' ' 1 Residual standard error: 5.668 on 5 degrees of freedom Multiple R-squared: 0.006853, Adjusted R-squared: -0.1918 F-statistic: 0.0345 on 1 and 5 DF, p-value: 0.8599
ที่เกี่ยวข้อง: วิธีตีความเอาต์พุตการถดถอยใน R
ตัวอย่างที่ 5: การใช้ summary() กับโมเดล ANOVA
รหัสต่อไปนี้แสดงวิธีใช้ฟังก์ชัน summary() เพื่อสรุปผลลัพธ์ของแบบจำลอง ANOVA ใน R:
#make this example reproducible set. seeds (0) #create data frame data <- data. frame (program = rep (c("A", "B", "C"), each = 30 ), weight_loss = c(runif(30, 0, 3), runif(30, 0, 5), runif(30, 1, 7))) #fit ANOVA model model <- aov(weight_loss ~ program, data = data) #summarize model fit summary(model) Df Sum Sq Mean Sq F value Pr(>F) program 2 98.93 49.46 30.83 7.55e-11 *** Residuals 87 139.57 1.60 --- Significant. codes: 0 '***' 0.001 '**' 0.01 '*' 0.05 '.' 0.1 ' ' 1
ที่เกี่ยวข้อง: วิธีการตีความผลลัพธ์ ANOVA ใน R
แหล่งข้อมูลเพิ่มเติม
บทช่วยสอนต่อไปนี้ให้ข้อมูลเพิ่มเติมเกี่ยวกับการคำนวณสถิติสรุปใน R:
วิธีการคำนวณผลสรุปของตัวเลขห้าตัวใน R
วิธีที่ง่ายที่สุดในการสร้างตารางสรุปใน R
วิธีสร้างตารางความถี่สัมพัทธ์ใน R