So berechnen sie den variationskoeffizienten von r


Ein Variationskoeffizient , oft mit CV abgekürzt, ist eine Möglichkeit, die Streuung von Werten in einem Datensatz relativ zum Mittelwert zu messen. Es wird wie folgt berechnet:

CV = σ / μ

Gold:

  • σ: die Standardabweichung des Datensatzes
  • μ: der Durchschnitt des Datensatzes

Vereinfacht ausgedrückt ist der Variationskoeffizient einfach das Verhältnis der Standardabweichung zum Mittelwert.

Wann ist der Variationskoeffizient zu verwenden?

Der Variationskoeffizient wird häufig verwendet, um die Variation zwischen zwei verschiedenen Datensätzen zu vergleichen.

In der realen Welt wird es im Finanzwesen häufig verwendet, um die durchschnittliche erwartete Rendite einer Investition mit der erwarteten Standardabweichung der Investition zu vergleichen. Dadurch können Anleger das Risiko-Rendite-Verhältnis zwischen Anlagen vergleichen.

Angenommen, ein Anleger erwägt eine Investition in die folgenden zwei Investmentfonds:

Investmentfonds A: Mittelwert = 9 %, Standardabweichung = 12,4 %

OGAW B: Durchschnitt = 5 %, Standardabweichung = 8,2 %

Durch die Berechnung des Variationskoeffizienten jedes Fonds stellt der Anleger Folgendes fest:

CV für Investmentfonds A = 12,4 % / 9 % = 1,38

CV für Investmentfonds B = 8,2 % / 5 % = 1,64

Da Investmentfonds A einen niedrigeren Variationskoeffizienten aufweist, bietet er im Vergleich zur Standardabweichung eine bessere Durchschnittsrendite.

So berechnen Sie den Variationskoeffizienten von R

Um den Variationskoeffizienten eines Datensatzes in R zu berechnen, können Sie die folgende Syntax verwenden:

 cv <- sd(data) / mean(data) * 100

Die folgenden Beispiele zeigen, wie Sie diese Syntax in der Praxis anwenden können.

Beispiel 1: Variationskoeffizient für einen einzelnen Vektor

Der folgende Code zeigt, wie der CV für einen einzelnen Vektor berechnet wird:

 #create vector of data
data <- c(88, 85, 82, 97, 67, 77, 74, 86, 81, 95, 77, 88, 85, 76, 81, 82)

#calculate CV
cv <- sd(data) / mean(data) * 100

#display CV
resume

[1] 9.234518

Der Variationskoeffizient beträgt 9,23 .

Beispiel 2: Variationskoeffizient für mehrere Vektoren

Der folgende Code zeigt, wie der CV mehrerer Vektoren in einem Datenrahmen mithilfe der Funktion sapply() berechnet wird:

 #create data frame
data <- data.frame(a=c(88, 85, 82, 97, 67, 77, 74, 86, 81, 95),
                   b=c(77, 88, 85, 76, 81, 82, 88, 91, 92, 99),
                   c=c(67, 68, 68, 74, 74, 76, 76, 77, 78, 84))

#calculate CV for each column in data frame
sapply(data, function (x) sd(x) / mean(x) * 100 )

        ABC
11.012892 8.330843 7.154009

Stellen Sie sicher, dass Sie na.rm=T verwenden, wenn in Ihren Daten auch Werte fehlen. Dies weist R an, fehlende Werte bei der Berechnung des Variationskoeffizienten einfach zu ignorieren:

 #create data frame
data <- data.frame(a=c(88, 85, 82, 97, 67, 77, 74, 86, 81, 95),
                   b=c(77, 88, 85, 76, 81, 82, 88, 91, NA , 99),
                   c=c(67, 68, 68, 74, 74, 76, 76, 77, 78, NA ))

#calculate CV for each column in data frame
sapply(data, function (x) sd(x, na.rm= T ) / mean(x, na.rm= T ) * 100 )

        ABC
11.012892 8.497612 5.860924

Zusätzliche Ressourcen

So berechnen Sie die absolute mittlere Abweichung in R
So berechnen Sie die Standardabweichung in R
So finden Sie den Bereich in R

Einen Kommentar hinzufügen

Deine E-Mail-Adresse wird nicht veröffentlicht. Erforderliche Felder sind mit * markiert