Comment calculer le coefficient de variation de R

Par Dr. Benjamin Anderson juillet 26, 2023 Guide 0 commentaire

Un coefficient de variation , souvent abrégé en CV , est un moyen de mesurer l’étalement des valeurs dans un ensemble de données par rapport à la moyenne. Il est calculé comme suit :

CV = σ / μ

où:

σ : l’écart type de l’ensemble de données
μ : la moyenne de l’ensemble de données

En clair, le coefficient de variation est simplement le rapport entre l’écart type et la moyenne.

Quand utiliser le coefficient de variation

Le coefficient de variation est souvent utilisé pour comparer la variation entre deux ensembles de données différents.

Dans le monde réel, il est souvent utilisé en finance pour comparer le rendement moyen attendu d’un investissement par rapport à l’écart type attendu de l’investissement. Cela permet aux investisseurs de comparer le compromis risque-rendement entre les investissements.

Par exemple, supposons qu’un investisseur envisage d’investir dans les deux fonds communs de placement suivants :

Fonds commun de placement A : moyenne = 9 %, écart-type = 12,4 %

OPCVM B : moyenne = 5 %, écart-type = 8,2 %

En calculant le coefficient de variation de chaque fonds, l’investisseur constate :

CV pour le fonds commun de placement A = 12,4 % /9 % = 1,38

CV pour le fonds commun de placement B = 8,2 % / 5 % = 1,64

Étant donné que le fonds commun de placement A a un coefficient de variation plus faible, il offre un meilleur rendement moyen par rapport à l’écart type.

Comment calculer le coefficient de variation de R

Pour calculer le coefficient de variation d’un ensemble de données dans R, vous pouvez utiliser la syntaxe suivante :

cv <- sd(data) / mean(data) * 100

Les exemples suivants montrent comment utiliser cette syntaxe dans la pratique.

Exemple 1 : Coefficient de variation pour un seul vecteur

Le code suivant montre comment calculer le CV pour un seul vecteur :

#create vector of data
data <- c(88, 85, 82, 97, 67, 77, 74, 86, 81, 95, 77, 88, 85, 76, 81, 82)

#calculate CV
cv <- sd(data) / mean(data) * 100

#display CV
cv

[1] 9.234518

Le coefficient de variation s’avère être de 9,23 .

Exemple 2 : Coefficient de variation pour plusieurs vecteurs

Le code suivant montre comment calculer le CV de plusieurs vecteurs dans un bloc de données à l’aide de la fonction sapply() :

#create data frame
data <- data.frame(a=c(88, 85, 82, 97, 67, 77, 74, 86, 81, 95),
                   b=c(77, 88, 85, 76, 81, 82, 88, 91, 92, 99),
                   c=c(67, 68, 68, 74, 74, 76, 76, 77, 78, 84))

#calculate CV for each column in data frame
sapply(data, function(x) sd(x) / mean(x) * 100)

        a         b         c 
11.012892  8.330843  7.154009

Assurez-vous d’utiliser na.rm=T s’il manque également des valeurs dans vos données. Cela indique à R d’ignorer simplement les valeurs manquantes lors du calcul du coefficient de variation :

#create data frame
data <- data.frame(a=c(88, 85, 82, 97, 67, 77, 74, 86, 81, 95),
                   b=c(77, 88, 85, 76, 81, 82, 88, 91, NA, 99),
                   c=c(67, 68, 68, 74, 74, 76, 76, 77, 78, NA))

#calculate CV for each column in data frame
sapply(data, function(x) sd(x, na.rm=T) / mean(x, na.rm=T) * 100)

        a         b         c 
11.012892  8.497612  5.860924

Ressources additionnelles

Comment calculer l’écart médian absolu dans R
Comment calculer l’écart type dans R
Comment trouver la plage dans R

à propos de l'auteur

Dr. Benjamin Anderson

Il est un professeur de statistiques à la retraite devenu éducateur dévoué sur Statorials. Avec une vaste expérience et une expertise dans le domaine des statistiques, je m'engage à partager mes connaissances pour responsabiliser les étudiants grâce à Statorials. Lire plus

Quand utiliser le coefficient de variation

Comment calculer le coefficient de variation de R

Ressources additionnelles

à propos de l'auteur

Dr. Benjamin Anderson

Ajouter un commentaire