Cara menghitung koefisien variasi dengan python


Koefisien variasi , sering disingkat CV , adalah cara mengukur penyebaran nilai dalam kumpulan data relatif terhadap mean. Ini dihitung sebagai berikut:

CV = σ / μ

Emas:

  • σ : deviasi standar kumpulan data
  • μ: rata-rata kumpulan data

Sederhananya, koefisien variasi hanyalah rasio deviasi standar terhadap mean.

Kapan menggunakan koefisien variasi

Koefisien variasi sering digunakan untuk membandingkan variasi antara dua kumpulan data yang berbeda.

Di dunia nyata, ini sering digunakan di bidang keuangan untuk membandingkan rata-rata pengembalian yang diharapkan dari suatu investasi dengan deviasi standar yang diharapkan dari investasi tersebut. Hal ini memungkinkan investor untuk membandingkan tradeoff risiko-pengembalian antar investasi.

Misalnya, seorang investor sedang mempertimbangkan untuk berinvestasi pada dua reksa dana berikut:

Reksa Dana A: mean = 9%, standar deviasi = 12,4%

UCITS B: rata-rata = 5%, standar deviasi = 8,2%

Dengan menghitung koefisien variasi masing-masing dana, investor mencatat:

CV reksa dana A = 12,4% /9% = 1,38

CV Reksa Dana B = 8,2% / 5% = 1,64

Karena Reksa Dana A memiliki koefisien variasi yang lebih rendah, maka Reksa Dana A memberikan pengembalian rata-rata yang lebih baik dibandingkan dengan standar deviasi.

Cara Menghitung Koefisien Variasi dengan Python

Untuk menghitung koefisien variasi kumpulan data dengan Python, Anda dapat menggunakan sintaks berikut:

 import numpy as np

cv = lambda x: np. std (x, ddof= 1 ) / np. mean (x) * 100

Contoh berikut menunjukkan cara menggunakan sintaksis ini dalam praktiknya.

Contoh 1: Koefisien variasi untuk satu jaringan

Kode berikut menunjukkan cara menghitung CV untuk satu tabel:

 #create vector of data
data = [88, 85, 82, 97, 67, 77, 74, 86, 81, 95, 77, 88, 85, 76, 81, 82]

#define function to calculate cv
cv = lambda x: np. std (x, ddof= 1 ) / np. mean (x) * 100 

#calculate CV
cv(data)

9.234518

Koefisien variasinya ternyata 9,23 .

Contoh 2: Koefisien variasi untuk beberapa vektor

Kode berikut menunjukkan cara menghitung CV beberapa kolom di pandas DataFrame:

 import numpy as np
import pandas as pd

#define function to calculate cv
cv = lambda x: np. std (x, ddof= 1 ) / np. mean (x) * 100

#create pandas DataFrame
df = pd. DataFrame ({'a': [88, 85, 82, 97, 67, 77, 74, 86, 81, 95],
                   'b': [77, 88, 85, 76, 81, 82, 88, 91, 92, 99],
                   'c': [67, 68, 68, 74, 74, 76, 76, 77, 78, 84]})

#calculate CV for each column in data frame
df. apply (cv)

a 11.012892
b8.330843
c7.154009
dtype:float64

Perhatikan bahwa nilai yang hilang akan diabaikan begitu saja saat menghitung koefisien variasi:

 import numpy as np
import pandas as pd

#define function to calculate cv
cv = lambda x: np. std (x, ddof= 1 ) / np. mean (x) * 100

#create pandas DataFrame
df = pd. DataFrame ({'a': [88, 85, 82, 97, 67, 77, 74, 86, 81, 95],
                   'b': [77, 88, 85, 76, 81, 82, 88, 91, np. no , 99],
                   'c': [67, 68, 68, 74, 74, 76, 76, 77, 78, np. no ]})

#calculate CV for each column in data frame
df. apply (cv)

a 11.012892
b 8.497612
c5.860924
dtype:float64

Sumber daya tambahan

Cara menghitung koefisien variasi R
Cara Menghitung Koefisien Variasi di Excel
Cara Menghitung Koefisien Variasi di Google Sheets

Tambahkan komentar

Alamat email Anda tidak akan dipublikasikan. Ruas yang wajib ditandai *