วิธีสร้างตารางความถี่สัมพัทธ์ใน r
ตารางความถี่สัมพัทธ์ จะบอกคุณว่าค่าบางค่าในชุดข้อมูลปรากฏบ่อยเพียงใด โดยสัมพันธ์ กับจำนวนค่าทั้งหมดในชุดข้อมูล
คุณสามารถใช้ไวยากรณ์พื้นฐานต่อไปนี้เพื่อสร้างตารางความถี่ใน R:
table(data)/length(data)
ฟังก์ชัน table() จะคำนวณความถี่ของค่าข้อมูลแต่ละค่า และฟังก์ชัน length() จะคำนวณจำนวนค่าทั้งหมดในชุดข้อมูล
ดังนั้น โดยการหารแต่ละความถี่ด้วยความยาวของชุดข้อมูล เราจะได้ความถี่สัมพัทธ์ของแต่ละค่าในชุดข้อมูล
ตัวอย่างต่อไปนี้แสดงวิธีใช้ไวยากรณ์นี้ในทางปฏิบัติ
ตัวอย่างที่ 1: ตารางความถี่สัมพัทธ์สำหรับเวกเตอร์
รหัสต่อไปนี้แสดงวิธีการสร้างตารางความถี่สัมพัทธ์สำหรับเวกเตอร์เดี่ยวใน R:
#define data data <- c('A', 'A', 'B', 'B', 'B', 'C', 'C', 'C', 'C', 'C') #create relative frequency table table(data)/length(data) ABC 0.2 0.3 0.5
ต่อไปนี้เป็นวิธีการตีความตาราง:
- 20% ของค่าทั้งหมดในชุดข้อมูลคือตัวอักษร A
- 30% ของค่าทั้งหมดในชุดข้อมูลคือตัวอักษร B
- 50% ของค่าทั้งหมดในชุดข้อมูลคือตัวอักษร C
ตัวอย่างที่ 2: ตารางความถี่สัมพัทธ์สำหรับคอลัมน์กรอบข้อมูล
รหัสต่อไปนี้แสดงวิธีการสร้างตารางความถี่สัมพัทธ์สำหรับคอลัมน์ของกรอบข้อมูลใน R:
#define data frame df <- data. frame (team=c('A', 'A', 'A', 'A', 'A', 'B', 'B', 'C'), wins=c(2, 9, 11, 12, 15, 17, 18, 19), dots=c(1, 2, 2, 2, 3, 3, 3, 3)) #view first few rows of data frame head(df) team wins points 1 to 2 1 2 to 9 2 3 to 11 2 4 to 12 2 5 to 15 3 6 B 17 3 #calculate relative frequency table for 'team' column table(df$team)/length(df$team) ABC 0.625 0.250 0.125
ตัวอย่างที่ 3: ตารางความถี่สัมพัทธ์สำหรับคอลัมน์ทั้งหมดในกรอบข้อมูล
รหัสต่อไปนี้แสดงวิธีการสร้างตารางความถี่สัมพัทธ์สำหรับแต่ละคอลัมน์ของกรอบข้อมูลใน R:
#define data frame df <- data. frame (team=c('A', 'A', 'A', 'A', 'A', 'B', 'B', 'C'), wins=c(2, 9, 11, 12, 15, 17, 18, 19), dots=c(1, 2, 2, 2, 3, 3, 3, 3)) #calculate relative frequency table for each column sapply(df, function (x) table(x)/nrow(df)) $team x ABC 0.625 0.250 0.125 $wins x 2 9 11 12 15 17 18 19 0.125 0.125 0.125 0.125 0.125 0.125 0.125 0.125 $points x 1 2 3 0.125 0.375 0.500
แหล่งข้อมูลเพิ่มเติม
วิธีสร้างตารางความถี่ใน R
วิธีสร้างตารางความถี่ของตัวแปรหลายตัวใน R