วิธีรวมหลายคอลัมน์ใน r (พร้อมตัวอย่าง)


เราสามารถใช้ฟังก์ชัน Aggregate() ใน R เพื่อสร้างสถิติสรุปสำหรับตัวแปรตั้งแต่หนึ่งตัวขึ้นไปในกรอบข้อมูล

ฟังก์ชันนี้ใช้ไวยากรณ์พื้นฐานต่อไปนี้:

รวม (sum_var ~ group_var, ข้อมูล = df, FUN = ค่าเฉลี่ย)

ทอง:

  • sum_var: ตัวแปรที่จะสรุป
  • group_var: ตัวแปรที่จะจัดกลุ่ม
  • data: ชื่อของบล็อกข้อมูล
  • ความสนุก: สถิติสรุปในการคำนวณ

บทช่วยสอนนี้มีตัวอย่างหลายประการของการใช้ฟังก์ชันนี้เพื่อรวมคอลัมน์ตั้งแต่หนึ่งคอลัมน์ขึ้นไปในแต่ละครั้งใน R โดยใช้กรอบข้อมูลต่อไปนี้เป็นตัวอย่าง:

 #create data frame
df <- data. frame (team=c('A', 'A', 'A', 'B', 'B', 'B', 'C', 'C'),
                 conf=c('E', 'E', 'W', 'W', 'W', 'W', 'W', 'W'),
                 points=c(1, 3, 3, 4, 5, 7, 7, 9),
                 rebounds=c(7, 7, 8, 3, 2, 7, 14, 13))

#view data frame
df

  team conf points rebounds
1 AE 1 7
2 AE 3 7
3 AW 3 8
4 BW 4 3
5 BW 5 2
6 BW 7 7
7 CW 7 14
8 CW 9 13

ตัวอย่างที่ 1: การสรุปตัวแปรและการจัดกลุ่มตามตัวแปร

รหัสต่อไปนี้แสดงวิธีการหาคะแนนเฉลี่ยที่จัดกลุ่มตามทีม:

 #find mean points scored, grouped by team
aggregate(points ~ team, data = df, FUN = mean, na. rm = TRUE )

  team points
1 A 2.333333
2 B 5.333333
3 C 8.000000

ตัวอย่างที่ 2: การสรุปตัวแปรและการจัดกลุ่มตามตัวแปรหลายตัว

รหัสต่อไปนี้แสดงวิธีค้นหาคะแนนเฉลี่ยที่จัดกลุ่มตามทีมและการประชุม:

 #find mean points scored, grouped by team and conference
aggregate(points ~ team + conf, data = df, FUN = mean, na. rm = TRUE )

  team conf points
1 AE 2.000000
2 AW 3.000000
3 BW 5.333333
4 CW 8.000000

ตัวอย่างที่ 3: สรุปตัวแปรหลายตัวและจัดกลุ่มตามตัวแปรเดียว

รหัสต่อไปนี้แสดงวิธีการค้นหาค่าเฉลี่ยการให้คะแนนและค่าเฉลี่ยการสะท้อนกลับ ซึ่งจัดกลุ่มตามทีม:

 #find mean points scored, grouped by team and conference
aggregate( cbind (points,rebounds) ~ team, data = df, FUN = mean, na. rm = TRUE )

  team points rebounds
1 A 2.333333 7.333333
2 B 5.333333 4.000000
3 C 8.000000 13.500000

ตัวอย่างที่ 4: การสรุปตัวแปรหลายตัวและการจัดกลุ่มตามตัวแปรหลายตัว

รหัสต่อไปนี้แสดงวิธีการค้นหาค่าเฉลี่ยการให้คะแนนและค่าเฉลี่ยการสะท้อนกลับ ซึ่งจัดกลุ่มตามทีมและการประชุม:

 #find mean points scored, grouped by team and conference
aggregate( cbind (points,rebounds) ~ team + conf, data = df, FUN = mean, na. rm = TRUE )

  team conf points rebounds
1 AE 2.000000 7.0
2AW 3.000000 8.0
3 BW 5.333333 4.0
4 CW 8.000000 13.5

แหล่งข้อมูลเพิ่มเติม

วิธีการคำนวณค่าเฉลี่ยของหลายคอลัมน์ใน R
วิธีรวมคอลัมน์เฉพาะใน R
วิธีรวมแถวเฉพาะใน R

เพิ่มความคิดเห็น

อีเมลของคุณจะไม่แสดงให้คนอื่นเห็น ช่องข้อมูลจำเป็นถูกทำเครื่องหมาย *