คำแนะนำในการใช้(), lapply(), sapply() และ tapply() ใน r


บทช่วยสอนนี้จะอธิบายความแตกต่างระหว่างฟังก์ชัน R ในตัว Apply() , sapply() , lapply() และ tapply() พร้อมด้วยตัวอย่างว่าจะใช้แต่ละฟังก์ชันเมื่อใดและอย่างไร

นำมาใช้()

ใช้ฟังก์ชัน Apply() เมื่อคุณต้องการใช้ฟังก์ชันกับแถวหรือคอลัมน์ของเมทริกซ์หรือกรอบข้อมูล

ไวยากรณ์พื้นฐานของฟังก์ชัน Apply() คือ:

ใช้ (X, มาร์จิ้น, สนุก)

  • X คือชื่อของอาร์เรย์หรือบล็อกข้อมูล
  • MARGIN บ่งชี้ว่ามิติใดที่จะดำเนินการ (1 = แถว, 2 = คอลัมน์)
  • FUN คือการดำเนินการเฉพาะที่คุณต้องการดำเนินการ (เช่น ต่ำสุด สูงสุด ผลรวม ค่าเฉลี่ย ฯลฯ)

โค้ดต่อไปนี้แสดงตัวอย่างการใช้งานจริงของ Apply() หลายตัวอย่าง

 #create a data frame with three columns and five rows
data <- data.frame(a = c(1, 3, 7, 12, 9),
                   b = c(4, 4, 6, 7, 8),
                   c = c(14, 15, 11, 10, 6))
data

#abc
#1 1 4 14
#2 3 4 15
#3 7 6 11
#4 12 7 10
#5 9 8 6

#find the sum of each row
apply(data, 1, sum)

#[1] 19 22 24 29 23

#find the sum of each column
apply(data, 2, sum)

#abc
#32 29 56 

#find the mean of each row
apply(data, 1, mean)

#[1] 6.333333 7.333333 8.000000 9.666667 7.666667

#find the mean of each column, rounded to one decimal place
round(apply(data, 2, mean), 1)

#abc
#6.4 5.8 11.2 

#find the standard deviation of each row
apply(data, 1, sd)

#[1] 6.806859 6.658328 2.645751 2.516611 1.527525

#find the standard deviation of each column
apply(data, 2, sd)

#abc
#4.449719 1.788854 3.563706 

นำมาใช้()

ใช้ฟังก์ชัน lapply() เมื่อคุณต้องการใช้ฟังก์ชันกับแต่ละองค์ประกอบของรายการ เวกเตอร์ หรือกรอบข้อมูล และรับผลลัพธ์เป็นรายการ

ไวยากรณ์พื้นฐานของฟังก์ชัน lapply() คือ:

ค่อยเป็นค่อยไป(X, FUN)

  • X คือชื่อของรายการ เวกเตอร์ หรือกรอบข้อมูล
  • FUN คือการดำเนินการเฉพาะที่คุณต้องการดำเนินการ

รหัสต่อไปนี้สาธิตตัวอย่างต่างๆ ของการใช้ lapply() กับคอลัมน์ในกรอบข้อมูล

 #create a data frame with three columns and five rows
data <- data.frame(a = c(1, 3, 7, 12, 9),
                   b = c(4, 4, 6, 7, 8),
                   c = c(14, 15, 11, 10, 6))
data

#abc
#1 1 4 14
#2 3 4 15
#3 7 6 11
#4 12 7 10
#5 9 8 6

#find mean of each column and return results as a list
apply(data, mean)

#$a
# [1] 6.4
#
# $b
# [1] 5.8
#
# $c
# [1] 11.2

#multiply values in each column by 2 and return results as a list
lapply(data, function(data) data*2)

#$a
# [1] 2 6 14 24 18
#
# $b
# [1] 8 8 12 14 16
#
# $c
# [1] 28 30 22 20 12

เรายังสามารถใช้ lapply() เพื่อดำเนินการกับรายการต่างๆ ได้ ตัวอย่างต่อไปนี้แสดงวิธีการทำเช่นนี้

 #create a list
x <- list(a=1, b=1:5, c=1:10) 
x

#$a
# [1] 1
#
# $b
# [1] 1 2 3 4 5
#
# $c
# [1] 1 2 3 4 5 6 7 8 9 10

#find the sum of each element in the list
lapply(x, sum)

#$a
# [1] 1
#
# $b
# [1] 15
#
# $c
#[1]55

#find the mean of each element in the list
lapply(x, mean)

#$a
# [1] 1
#
# $b
# [1] 3
#
# $c
# [1] 5.5

#multiply values of each element by 5 and return results as a list
lapply(x, function(x) x*5)

#$a
# [1] 5
#
# $b
# [1] 5 10 15 20 25
#
# $c
# [1] 5 10 15 20 25 30 35 40 45 50

นำมาใช้()

ใช้ฟังก์ชัน sapply() เมื่อคุณต้องการใช้ฟังก์ชันกับแต่ละองค์ประกอบของรายการ เวกเตอร์ หรือกรอบข้อมูล ดังนั้นจึงได้รับ เวกเตอร์ แทนรายการ

ไวยากรณ์พื้นฐานของฟังก์ชัน sapply() คือ:

สมัคร (X, สนุก)

  • X คือชื่อของรายการ เวกเตอร์ หรือกรอบข้อมูล
  • FUN คือการดำเนินการเฉพาะที่คุณต้องการดำเนินการ

โค้ดต่อไปนี้สาธิตตัวอย่างการใช้ sapply() กับคอลัมน์ใน data frame

 #create a data frame with three columns and five rows
data <- data.frame(a = c(1, 3, 7, 12, 9),
                   b = c(4, 4, 6, 7, 8),
                   c = c(14, 15, 11, 10, 6))
data

#abc
#1 1 4 14
#2 3 4 15
#3 7 6 11
#4 12 7 10
#5 9 8 6

#find mean of each column and return results as a vector
sapply(data, mean)

#abc
#6.4 5.8 11.2 

#multiply values in each column by 2 and return results as a matrix
sapply(data, function(data) data*2)

#abc
#[1,] 2 8 28
#[2,] 6 8 30
#[3,] 14 12 22
#[4,] 24 14 20
#[5,] 18 16 12

เรายังสามารถใช้ sapply() เพื่อดำเนินการกับรายการต่างๆ ได้ ตัวอย่างต่อไปนี้แสดงวิธีการทำเช่นนี้

 #create a list
x <- list(a=1, b=1:5, c=1:10) 
x

#$a
# [1] 1
#
# $b
# [1] 1 2 3 4 5
#
# $c
# [1] 1 2 3 4 5 6 7 8 9 10

#find the sum of each element in the list
sapply(x, sum)

#abc
#1 15 55 

#find the mean of each element in the list
sapply(x, mean)

#abc
#1.0 3.0 5.5

แตะ()

ใช้ฟังก์ชัน tapply() เมื่อคุณต้องการใช้ฟังก์ชันกับชุดย่อยของเวกเตอร์ และชุดย่อยถูกกำหนดโดยเวกเตอร์อื่น ซึ่งโดยปกติจะเป็นปัจจัย

ไวยากรณ์พื้นฐานของฟังก์ชัน tapply() คือ:

แตะ(X, ดัชนี, สนุก)

  • X คือชื่อของวัตถุ ซึ่งโดยปกติจะเป็นเวกเตอร์
  • INDEX คือรายการของปัจจัยตั้งแต่หนึ่งตัวขึ้นไป
  • FUN คือการดำเนินการเฉพาะที่คุณต้องการดำเนินการ

โค้ดต่อไปนี้แสดงตัวอย่างการใช้ tapply() บน ชุด ข้อมูล R ที่ฝังด้วยม่านตา

 #view first six lines of iris dataset
head(iris)

# Sepal.Length Sepal.Width Petal.Length Petal.Width Species
#1 5.1 3.5 1.4 0.2 setosa
#2 4.9 3.0 1.4 0.2 setosa
#3 4.7 3.2 1.3 0.2 setosa
#4 4.6 3.1 1.5 0.2 setosa
#5 5.0 3.6 1.4 0.2 setosa
#6 5.4 3.9 1.7 0.4 setosa

#find the max Sepal.Length of each of the three Species
tapply(iris$Sepal.Length, iris$Species, max)

#setosa versicolor virginica 
#5.8 7.0 7.9 

#find the mean Sepal.Width of each of the three Species
tapply(iris$Sepal.Width, iris$Species, mean)

# setosa versicolor virginica 
# 3,428 2,770 2,974

#find the minimum Petal.Width of each of the three Species
tapply(iris$Petal.Width, iris$Species, min)

# setosa versicolor virginica 
#0.1 1.0 1.4 

เพิ่มความคิดเห็น

อีเมลของคุณจะไม่แสดงให้คนอื่นเห็น ช่องข้อมูลจำเป็นถูกทำเครื่องหมาย *