วิธีการคำนวณค่าเฉลี่ยแบบเล็มใน python (พร้อมตัวอย่าง)


ค่าเฉลี่ยที่ถูกตัดแต่ง คือค่าเฉลี่ยของชุดข้อมูลที่คำนวณหลังจากลบเปอร์เซ็นต์เฉพาะของค่าที่เล็กที่สุดและใหญ่ที่สุดในชุดข้อมูลออก

วิธีที่ง่ายที่สุดในการคำนวณค่าเฉลี่ยแบบเล็มใน Python คือการใช้ฟังก์ชัน trim_mean() จากไลบรารี SciPy

ฟังก์ชันนี้ใช้ไวยากรณ์พื้นฐานต่อไปนี้:

 from scipy import stats

#calculate 10% trimmed mean
stats. trim_mean (data, 0.1 )

ตัวอย่างต่อไปนี้แสดงวิธีใช้ฟังก์ชันนี้เพื่อคำนวณค่าเฉลี่ยที่ถูกตัดแต่งในทางปฏิบัติ

ตัวอย่างที่ 1: คำนวณค่าเฉลี่ยแบบตัดของตาราง

รหัสต่อไปนี้แสดงวิธีการคำนวณค่าเฉลี่ยที่ถูกตัดแต่ง 10% สำหรับตารางข้อมูล:

 from scipy import stats

#define data
data = [22, 25, 29, 11, 14, 18, 13, 13, 17, 11, 8, 8, 7, 12, 15, 6, 8, 7, 9, 12]

#calculate 10% trimmed mean
stats. trim_mean (data, 0.1 )

12,375

ค่าเฉลี่ยที่ถูกตัดแต่ง 10% คือ 12.375

นี่คือค่าเฉลี่ยของชุดข้อมูลหลังจากลบค่าที่น้อยที่สุด 10% และค่าที่ใหญ่ที่สุด 10% ออกจากชุดข้อมูลแล้ว

ตัวอย่างที่ 2: คำนวณค่าเฉลี่ยของคอลัมน์ที่ถูกตัดแต่งใน Pandas

รหัสต่อไปนี้แสดงวิธีการคำนวณค่าเฉลี่ยที่ตัดแต่ง 5% สำหรับคอลัมน์เฉพาะใน DataFrame ของแพนด้า:

 from scipy import stats
import pandas as pd

#define DataFrame
df = pd. DataFrame ({' points ': [25, 12, 15, 14, 19, 23, 25, 29],
                   ' assists ': [5, 7, 7, 9, 12, 9, 9, 4],
                   ' rebounds ': [11, 8, 10, 6, 6, 5, 9, 12]})


#calculate 5% trimmed mean of points
stats. trim_mean (df. points , 0.05 ) 

20.25

ค่าเฉลี่ยที่ตัดแต่งแล้ว 5% ของค่าในคอลัมน์ “คะแนน” คือ 20.25

นี่คือค่าเฉลี่ยของคอลัมน์ “คะแนน” หลังจากลบค่าที่น้อยที่สุด 5% และค่าที่ใหญ่ที่สุด 5% ออกแล้ว

ตัวอย่างที่ 3: คำนวณค่าเฉลี่ยแบบตัดของหลายคอลัมน์

รหัสต่อไปนี้แสดงวิธีการคำนวณค่าเฉลี่ยที่ถูกตัดแต่ง 5% สำหรับหลายคอลัมน์ใน DataFrame ของแพนด้า:

 from scipy import stats
import pandas as pd

#define DataFrame
df = pd. DataFrame ({' points ': [25, 12, 15, 14, 19, 23, 25, 29],
                   ' assists ': [5, 7, 7, 9, 12, 9, 9, 4],
                   ' rebounds ': [11, 8, 10, 6, 6, 5, 9, 12]})


#calculate 5% trimmed mean of 'points' and 'assists' columns
stats. trim_mean (df[[' points ', ' assists ']], 0.05 )

array([20.25, 7.75])

จากผลลัพธ์เราจะเห็นได้ว่า:

  • ค่าเฉลี่ยที่ถูกตัดออก 5% ของคอลัมน์ “คะแนน” คือ 20.25
  • ค่าเฉลี่ยที่ถูกตัดออก 5% ของคอลัมน์ “แอสซิสต์” คือ 7.75

หมายเหตุ : คุณสามารถดูเอกสารฉบับเต็มสำหรับฟังก์ชัน trim_mean() ได้ที่นี่

แหล่งข้อมูลเพิ่มเติม

วิธีการคำนวณค่าเฉลี่ยแบบเล็มด้วยตนเอง
เครื่องคิดเลขเฉลี่ยที่ถูกตัดแต่ง

เพิ่มความคิดเห็น

อีเมลของคุณจะไม่แสดงให้คนอื่นเห็น ช่องข้อมูลจำเป็นถูกทำเครื่องหมาย *