Cara menghitung rata-rata terpangkas dengan python (dengan contoh)


Rata-rata yang dipangkas adalah rata-rata kumpulan data yang telah dihitung setelah menghilangkan persentase tertentu dari nilai terkecil dan terbesar dalam kumpulan data tersebut.

Cara termudah untuk menghitung rata-rata yang dipangkas dengan Python adalah dengan menggunakan fungsi trim_mean() dari perpustakaan SciPy.

Fungsi ini menggunakan sintaks dasar berikut:

 from scipy import stats

#calculate 10% trimmed mean
stats. trim_mean (data, 0.1 )

Contoh berikut menunjukkan cara menggunakan fungsi ini untuk menghitung rata-rata terpangkas dalam praktiknya.

Contoh 1: Hitung rata-rata terpangkas dari tabel

Kode berikut menunjukkan cara menghitung rata-rata terpangkas 10% untuk tabel data:

 from scipy import stats

#define data
data = [22, 25, 29, 11, 14, 18, 13, 13, 17, 11, 8, 8, 7, 12, 15, 6, 8, 7, 9, 12]

#calculate 10% trimmed mean
stats. trim_mean (data, 0.1 )

12,375

Rata-rata yang dipangkas 10% adalah 12,375 .

Ini adalah rata-rata kumpulan data setelah 10% nilai terkecil dan 10% terbesar dihilangkan dari kumpulan data.

Contoh 2: Hitung Rata-Rata Kolom yang Dipangkas di Pandas

Kode berikut menunjukkan cara menghitung rata-rata pemangkasan 5% untuk kolom tertentu di pandas DataFrame:

 from scipy import stats
import pandas as pd

#define DataFrame
df = pd. DataFrame ({' points ': [25, 12, 15, 14, 19, 23, 25, 29],
                   ' assists ': [5, 7, 7, 9, 12, 9, 9, 4],
                   ' rebounds ': [11, 8, 10, 6, 6, 5, 9, 12]})


#calculate 5% trimmed mean of points
stats. trim_mean (df. points , 0.05 ) 

20.25

Rata-rata nilai yang dipangkas 5% di kolom “poin” adalah 20,25 .

Ini adalah rata-rata kolom “poin” setelah menghilangkan 5% nilai terkecil dan 5% terbesar.

Contoh 3: Hitung rata-rata terpangkas dari beberapa kolom

Kode berikut menunjukkan cara menghitung rata-rata pemangkasan 5% untuk beberapa kolom di pandas DataFrame:

 from scipy import stats
import pandas as pd

#define DataFrame
df = pd. DataFrame ({' points ': [25, 12, 15, 14, 19, 23, 25, 29],
                   ' assists ': [5, 7, 7, 9, 12, 9, 9, 4],
                   ' rebounds ': [11, 8, 10, 6, 6, 5, 9, 12]})


#calculate 5% trimmed mean of 'points' and 'assists' columns
stats. trim_mean (df[[' points ', ' assists ']], 0.05 )

array([20.25, 7.75])

Dari hasilnya kita dapat melihat:

  • Rata-rata kolom “poin” yang dipangkas 5% adalah 20,25 .
  • Rata-rata kolom “bantuan” yang dipangkas 5% adalah 7,75 .

Catatan : Anda dapat menemukan dokumentasi lengkap untuk fungsi trim_mean() di sini .

Sumber daya tambahan

Cara Menghitung Rata-Rata Terpangkas Secara Manual
Kalkulator Rata-rata yang Dipangkas

Tambahkan komentar

Alamat email Anda tidak akan dipublikasikan. Ruas yang wajib ditandai *