วิธีนับจำนวนครั้งที่เกิดขึ้นในคอลัมน์ใน r


คุณสามารถใช้ไวยากรณ์ต่อไปนี้ใน R เพื่อนับจำนวนการเกิดค่าบางค่าในคอลัมน์ของกรอบข้อมูล:

 #count number of occurrences of each value in column
table(df$column_name)

#count number of occurrences of each value (including NA values) in column
table(df$column_name, useNA = ' always ')

#count number of occurrences of specific value
length(which(df$column_name== value ))

ตัวอย่างต่อไปนี้แสดงวิธีใช้ไวยากรณ์นี้ในทางปฏิบัติกับกรอบข้อมูลต่อไปนี้:

 #create data frame
df <- data. frame (player=c('A', 'B', 'C', 'D', 'E', 'F'),
                 team=c('Mavs', 'Mavs', 'Suns', 'Nets', 'Nets', 'Nets'),
                 points=c(20, 22, 26, 30, 30, NA))

#view data frame
df

  player team points
1 A Mavs 20
2 B Mavs 22
3 C Suns 26
4 D Nets 30
5 E Nets 30
6 F Nets NA

ตัวอย่างที่ 1: นับจำนวนครั้งของค่าในคอลัมน์

รหัสต่อไปนี้แสดงวิธีการนับจำนวนครั้งของแต่ละค่าในคอลัมน์ “ทีม”:

 #count number of occurrences of each team
table(df$team)

Mavs Nets Suns 
   2 3 1 

สิ่งนี้บอกเรา:

  • ชื่อทีม “แมฟส์” ปรากฏ 2 ครั้ง
  • ชื่อทีม “ตาข่าย” ปรากฏ 3 ครั้ง
  • ชื่อทีม “ซันส์” ปรากฏ 1 ครั้ง

ตัวอย่างที่ 2: นับจำนวนครั้งของค่าในคอลัมน์ (รวมค่า NA)

รหัสต่อไปนี้แสดงวิธีการนับจำนวนครั้งของแต่ละค่า (รวมถึงค่า NA) ในคอลัมน์ “คะแนน”:

 #count number of occurrences of each value in 'points', including NA occurrences
table(df$points, useNA = ' always ')

  20 22 26 30 <NA>
   1 1 1 2 1

สิ่งนี้บอกเรา:

  • ค่า 20 ปรากฏ 1 ครั้ง
  • ค่า 22 ปรากฏ 1 ครั้ง
  • ค่า 26 ปรากฏ 1 ครั้ง
  • ค่า 30 ปรากฏขึ้นสองครั้ง
  • ค่า NA (ค่าที่หายไป) ปรากฏ 1 ครั้ง

ตัวอย่างที่ 3: นับจำนวนครั้งของค่าที่ระบุในคอลัมน์

รหัสต่อไปนี้แสดงวิธีนับจำนวนครั้งของค่า 30 ในคอลัมน์ “คะแนน”:

 #count number of occurrences of the value 30 in 'points' column
length(which(df$points == 30 ))

[1] 2

สิ่งนี้บอกเราว่าค่า 30 ปรากฏขึ้นสองครั้งในคอลัมน์ ‘คะแนน’

คุณยังสามารถใช้ไวยากรณ์ต่อไปนี้เพื่อนับจำนวนการเกิดของค่าที่แตกต่างกันหลายค่าในคอลัมน์ “คะแนน”:

 #count number of occurrences of the value 30 or 26 in 'points' column
length(which(df$points == 30 | df$points == 26 ))

[1] 3

สิ่งนี้บอกเราว่าค่า 30 หรือ 26 ปรากฏทั้งหมด 3 ครั้งในคอลัมน์ “คะแนน”

แหล่งข้อมูลเพิ่มเติม

วิธีรวมคอลัมน์เฉพาะใน R
วิธีการคำนวณค่าเฉลี่ยของหลายคอลัมน์ใน R
วิธีค้นหาค่าสูงสุดในหลายคอลัมน์ใน R

เพิ่มความคิดเห็น

อีเมลของคุณจะไม่แสดงให้คนอื่นเห็น ช่องข้อมูลจำเป็นถูกทำเครื่องหมาย *