วิธีการคำนวณค่าเฉลี่ยที่ถูกตัดแต่งใน r (พร้อมตัวอย่าง)


ค่าเฉลี่ยที่ถูกตัดแต่ง คือค่าเฉลี่ยของชุดข้อมูลที่คำนวณหลังจากลบเปอร์เซ็นต์เฉพาะของค่าที่เล็กที่สุดและใหญ่ที่สุดในชุดข้อมูลออก

ตัวอย่างเช่น ค่าเฉลี่ยที่ตัดออก 10% จะแสดงค่าเฉลี่ยของชุดข้อมูลหลังจากลบค่าที่น้อยที่สุด 10% และค่าที่ใหญ่ที่สุด 10% ออก

วิธีที่ง่ายที่สุดในการคำนวณค่าเฉลี่ยแบบตัดใน R คือการใช้ไวยากรณ์พื้นฐานต่อไปนี้:

 #calculate 10% trimmed mean
mean(x, trim= 0.1 )

ตัวอย่างต่อไปนี้แสดงวิธีใช้ฟังก์ชันนี้เพื่อคำนวณค่าเฉลี่ยที่ถูกตัดแต่งในทางปฏิบัติ

ตัวอย่างที่ 1: คำนวณค่าเฉลี่ยของเวกเตอร์

รหัสต่อไปนี้แสดงวิธีการคำนวณค่าเฉลี่ยที่ถูกตัดแต่ง 10% สำหรับเวกเตอร์ข้อมูล:

 #define data
data = c(22, 25, 29, 11, 14, 18, 13, 13, 17, 11, 8, 8, 7, 12, 15, 6, 8, 7, 9, 12)

#calculate 10% trimmed mean
mean(data, trim= 0.1 )

[1] 12,375

ค่าเฉลี่ยที่ถูกตัดแต่ง 10% คือ 12.375

นี่คือค่าเฉลี่ยของชุดข้อมูลหลังจากลบค่าที่น้อยที่สุด 10% และค่าที่ใหญ่ที่สุด 10% ออกจากชุดข้อมูลแล้ว

ตัวอย่างที่ 2: คำนวณค่าเฉลี่ยของคอลัมน์ในกรอบข้อมูล

รหัสต่อไปนี้แสดงวิธีการคำนวณค่าเฉลี่ยที่ตัดแต่ง 5% สำหรับคอลัมน์เฉพาะในกรอบข้อมูล:

 #create data frame
df = data. frame (points=c(25, 12, 15, 14, 19, 23, 25, 29),
                assists=c(5, 7, 7, 9, 12, 9, 9, 4),
                rebounds=c(11, 8, 10, 6, 6, 5, 9, 12))

#calculate 5% trimmed mean of points
mean(df$points, trim= 0.05 )

[1] 20.25

ค่าเฉลี่ยที่ตัดแต่งแล้ว 5% ของค่าในคอลัมน์ “คะแนน” คือ 20.25

นี่คือค่าเฉลี่ยของคอลัมน์ “คะแนน” หลังจากลบค่าที่น้อยที่สุด 5% และค่าที่ใหญ่ที่สุด 5% ออกแล้ว

ตัวอย่างที่ 3: คำนวณค่าเฉลี่ยแบบตัดของหลายคอลัมน์

รหัสต่อไปนี้แสดงวิธีการคำนวณค่าเฉลี่ยที่ตัดแต่ง 5% สำหรับหลายคอลัมน์ในกรอบข้อมูล:

 #create data frame
df = data. frame (points=c(25, 12, 15, 14, 19, 23, 25, 29),
                assists=c(5, 7, 7, 9, 12, 9, 9, 4),
                rebounds=c(11, 8, 10, 6, 6, 5, 9, 12))

#calculate 5% trimmed mean of points and assists
sapply(df[c(' points ', ' assists ')], function (x) mean(x, trim= 0.05 ))

 assist points 
  20.25 7.75 

จากผลลัพธ์เราจะเห็นได้ว่า:

  • ค่าเฉลี่ยที่ถูกตัดออก 5% ของคอลัมน์ “คะแนน” คือ 20.25
  • ค่าเฉลี่ยที่ถูกตัดออก 5% ของคอลัมน์ “แอสซิสต์” คือ 7.75

ที่เกี่ยวข้อง: คำแนะนำในการใช้ (), lapply (), sapply () และ tapply () ใน R

แหล่งข้อมูลเพิ่มเติม

บทช่วยสอนต่อไปนี้ให้ข้อมูลเพิ่มเติมเกี่ยวกับค่าเฉลี่ยที่ถูกตัดแต่ง:

วิธีการคำนวณค่าเฉลี่ยแบบเล็มด้วยตนเอง
วิธีการคำนวณค่าเฉลี่ยแบบเล็มใน Python
เครื่องคิดเลขเฉลี่ยที่ถูกตัดแต่ง

เพิ่มความคิดเห็น

อีเมลของคุณจะไม่แสดงให้คนอื่นเห็น ช่องข้อมูลจำเป็นถูกทำเครื่องหมาย *