Cara menghitung koefisien variasi dengan python
Koefisien variasi , sering disingkat CV , adalah cara mengukur penyebaran nilai dalam kumpulan data relatif terhadap mean. Ini dihitung sebagai berikut:
CV = σ / μ
Emas:
- σ : deviasi standar kumpulan data
- μ: rata-rata kumpulan data
Sederhananya, koefisien variasi hanyalah rasio deviasi standar terhadap mean.
Kapan menggunakan koefisien variasi
Koefisien variasi sering digunakan untuk membandingkan variasi antara dua kumpulan data yang berbeda.
Di dunia nyata, ini sering digunakan di bidang keuangan untuk membandingkan rata-rata pengembalian yang diharapkan dari suatu investasi dengan deviasi standar yang diharapkan dari investasi tersebut. Hal ini memungkinkan investor untuk membandingkan tradeoff risiko-pengembalian antar investasi.
Misalnya, seorang investor sedang mempertimbangkan untuk berinvestasi pada dua reksa dana berikut:
Reksa Dana A: mean = 9%, standar deviasi = 12,4%
UCITS B: rata-rata = 5%, standar deviasi = 8,2%
Dengan menghitung koefisien variasi masing-masing dana, investor mencatat:
CV reksa dana A = 12,4% /9% = 1,38
CV Reksa Dana B = 8,2% / 5% = 1,64
Karena Reksa Dana A memiliki koefisien variasi yang lebih rendah, maka Reksa Dana A memberikan pengembalian rata-rata yang lebih baik dibandingkan dengan standar deviasi.
Cara Menghitung Koefisien Variasi dengan Python
Untuk menghitung koefisien variasi kumpulan data dengan Python, Anda dapat menggunakan sintaks berikut:
import numpy as np cv = lambda x: np. std (x, ddof= 1 ) / np. mean (x) * 100
Contoh berikut menunjukkan cara menggunakan sintaksis ini dalam praktiknya.
Contoh 1: Koefisien variasi untuk satu jaringan
Kode berikut menunjukkan cara menghitung CV untuk satu tabel:
#create vector of data data = [88, 85, 82, 97, 67, 77, 74, 86, 81, 95, 77, 88, 85, 76, 81, 82] #define function to calculate cv cv = lambda x: np. std (x, ddof= 1 ) / np. mean (x) * 100 #calculate CV cv(data) 9.234518
Koefisien variasinya ternyata 9,23 .
Contoh 2: Koefisien variasi untuk beberapa vektor
Kode berikut menunjukkan cara menghitung CV beberapa kolom di pandas DataFrame:
import numpy as np import pandas as pd #define function to calculate cv cv = lambda x: np. std (x, ddof= 1 ) / np. mean (x) * 100 #create pandas DataFrame df = pd. DataFrame ({'a': [88, 85, 82, 97, 67, 77, 74, 86, 81, 95], 'b': [77, 88, 85, 76, 81, 82, 88, 91, 92, 99], 'c': [67, 68, 68, 74, 74, 76, 76, 77, 78, 84]}) #calculate CV for each column in data frame df. apply (cv) a 11.012892 b8.330843 c7.154009 dtype:float64
Perhatikan bahwa nilai yang hilang akan diabaikan begitu saja saat menghitung koefisien variasi:
import numpy as np import pandas as pd #define function to calculate cv cv = lambda x: np. std (x, ddof= 1 ) / np. mean (x) * 100 #create pandas DataFrame df = pd. DataFrame ({'a': [88, 85, 82, 97, 67, 77, 74, 86, 81, 95], 'b': [77, 88, 85, 76, 81, 82, 88, 91, np. no , 99], 'c': [67, 68, 68, 74, 74, 76, 76, 77, 78, np. no ]}) #calculate CV for each column in data frame df. apply (cv) a 11.012892 b 8.497612 c5.860924 dtype:float64
Sumber daya tambahan
Cara menghitung koefisien variasi R
Cara Menghitung Koefisien Variasi di Excel
Cara Menghitung Koefisien Variasi di Google Sheets