Cara menghitung koefisien variasi r
Koefisien variasi , sering disingkat CV , adalah cara mengukur penyebaran nilai dalam kumpulan data relatif terhadap mean. Ini dihitung sebagai berikut:
CV = σ / μ
Emas:
- σ : deviasi standar kumpulan data
- μ: rata-rata kumpulan data
Sederhananya, koefisien variasi hanyalah rasio deviasi standar terhadap mean.
Kapan menggunakan koefisien variasi
Koefisien variasi sering digunakan untuk membandingkan variasi antara dua kumpulan data yang berbeda.
Di dunia nyata, ini sering digunakan di bidang keuangan untuk membandingkan rata-rata pengembalian yang diharapkan dari suatu investasi dengan deviasi standar yang diharapkan dari investasi tersebut. Hal ini memungkinkan investor untuk membandingkan tradeoff risiko-pengembalian antar investasi.
Misalnya, seorang investor sedang mempertimbangkan untuk berinvestasi pada dua reksa dana berikut:
Reksa Dana A: mean = 9%, standar deviasi = 12,4%
UCITS B: rata-rata = 5%, standar deviasi = 8,2%
Dengan menghitung koefisien variasi masing-masing dana, investor mencatat:
CV reksa dana A = 12,4% /9% = 1,38
CV Reksa Dana B = 8,2% / 5% = 1,64
Karena Reksa Dana A memiliki koefisien variasi yang lebih rendah, maka Reksa Dana A memberikan pengembalian rata-rata yang lebih baik dibandingkan dengan standar deviasi.
Cara menghitung koefisien variasi R
Untuk menghitung koefisien variasi suatu kumpulan data di R, Anda dapat menggunakan sintaks berikut:
cv <- sd(data) / mean(data) * 100
Contoh berikut menunjukkan cara menggunakan sintaksis ini dalam praktiknya.
Contoh 1: Koefisien variasi untuk satu vektor
Kode berikut menunjukkan cara menghitung CV untuk satu vektor:
#create vector of data data <- c(88, 85, 82, 97, 67, 77, 74, 86, 81, 95, 77, 88, 85, 76, 81, 82) #calculate CV cv <- sd(data) / mean(data) * 100 #display CV resume [1] 9.234518
Koefisien variasinya ternyata 9,23 .
Contoh 2: Koefisien variasi untuk beberapa vektor
Kode berikut menunjukkan cara menghitung CV beberapa vektor dalam bingkai data menggunakan fungsi sapply() :
#create data frame data <- data.frame(a=c(88, 85, 82, 97, 67, 77, 74, 86, 81, 95), b=c(77, 88, 85, 76, 81, 82, 88, 91, 92, 99), c=c(67, 68, 68, 74, 74, 76, 76, 77, 78, 84)) #calculate CV for each column in data frame sapply(data, function (x) sd(x) / mean(x) * 100 ) ABC 11.012892 8.330843 7.154009
Pastikan untuk menggunakan na.rm=T jika data Anda juga tidak ada nilainya. Ini memberitahu R untuk mengabaikan nilai yang hilang saat menghitung koefisien variasi:
#create data frame data <- data.frame(a=c(88, 85, 82, 97, 67, 77, 74, 86, 81, 95), b=c(77, 88, 85, 76, 81, 82, 88, 91, NA , 99), c=c(67, 68, 68, 74, 74, 76, 76, 77, 78, NA )) #calculate CV for each column in data frame sapply(data, function (x) sd(x, na.rm= T ) / mean(x, na.rm= T ) * 100 ) ABC 11.012892 8.497612 5.860924
Sumber daya tambahan
Cara menghitung deviasi median absolut di R
Cara menghitung simpangan baku di R
Bagaimana menemukan jangkauan di R