Cara menghitung koefisien variasi r


Koefisien variasi , sering disingkat CV , adalah cara mengukur penyebaran nilai dalam kumpulan data relatif terhadap mean. Ini dihitung sebagai berikut:

CV = σ / μ

Emas:

  • σ : deviasi standar kumpulan data
  • μ: rata-rata kumpulan data

Sederhananya, koefisien variasi hanyalah rasio deviasi standar terhadap mean.

Kapan menggunakan koefisien variasi

Koefisien variasi sering digunakan untuk membandingkan variasi antara dua kumpulan data yang berbeda.

Di dunia nyata, ini sering digunakan di bidang keuangan untuk membandingkan rata-rata pengembalian yang diharapkan dari suatu investasi dengan deviasi standar yang diharapkan dari investasi tersebut. Hal ini memungkinkan investor untuk membandingkan tradeoff risiko-pengembalian antar investasi.

Misalnya, seorang investor sedang mempertimbangkan untuk berinvestasi pada dua reksa dana berikut:

Reksa Dana A: mean = 9%, standar deviasi = 12,4%

UCITS B: rata-rata = 5%, standar deviasi = 8,2%

Dengan menghitung koefisien variasi masing-masing dana, investor mencatat:

CV reksa dana A = 12,4% /9% = 1,38

CV Reksa Dana B = 8,2% / 5% = 1,64

Karena Reksa Dana A memiliki koefisien variasi yang lebih rendah, maka Reksa Dana A memberikan pengembalian rata-rata yang lebih baik dibandingkan dengan standar deviasi.

Cara menghitung koefisien variasi R

Untuk menghitung koefisien variasi suatu kumpulan data di R, Anda dapat menggunakan sintaks berikut:

 cv <- sd(data) / mean(data) * 100

Contoh berikut menunjukkan cara menggunakan sintaksis ini dalam praktiknya.

Contoh 1: Koefisien variasi untuk satu vektor

Kode berikut menunjukkan cara menghitung CV untuk satu vektor:

 #create vector of data
data <- c(88, 85, 82, 97, 67, 77, 74, 86, 81, 95, 77, 88, 85, 76, 81, 82)

#calculate CV
cv <- sd(data) / mean(data) * 100

#display CV
resume

[1] 9.234518

Koefisien variasinya ternyata 9,23 .

Contoh 2: Koefisien variasi untuk beberapa vektor

Kode berikut menunjukkan cara menghitung CV beberapa vektor dalam bingkai data menggunakan fungsi sapply() :

 #create data frame
data <- data.frame(a=c(88, 85, 82, 97, 67, 77, 74, 86, 81, 95),
                   b=c(77, 88, 85, 76, 81, 82, 88, 91, 92, 99),
                   c=c(67, 68, 68, 74, 74, 76, 76, 77, 78, 84))

#calculate CV for each column in data frame
sapply(data, function (x) sd(x) / mean(x) * 100 )

        ABC
11.012892 8.330843 7.154009

Pastikan untuk menggunakan na.rm=T jika data Anda juga tidak ada nilainya. Ini memberitahu R untuk mengabaikan nilai yang hilang saat menghitung koefisien variasi:

 #create data frame
data <- data.frame(a=c(88, 85, 82, 97, 67, 77, 74, 86, 81, 95),
                   b=c(77, 88, 85, 76, 81, 82, 88, 91, NA , 99),
                   c=c(67, 68, 68, 74, 74, 76, 76, 77, 78, NA ))

#calculate CV for each column in data frame
sapply(data, function (x) sd(x, na.rm= T ) / mean(x, na.rm= T ) * 100 )

        ABC
11.012892 8.497612 5.860924

Sumber daya tambahan

Cara menghitung deviasi median absolut di R
Cara menghitung simpangan baku di R
Bagaimana menemukan jangkauan di R

Tambahkan komentar

Alamat email Anda tidak akan dipublikasikan. Ruas yang wajib ditandai *