So berechnen sie dezile in r (mit beispielen)


In der Statistik sind Dezile Zahlen, die einen Datensatz in zehn Gruppen gleicher Häufigkeit unterteilen.

Das erste Dezil ist der Punkt, den 10 % aller Datenwerte unterschreiten. Das zweite Dezil ist der Punkt, an dem 20 % aller Datenwerte unterschritten werden, und so weiter.

Wir können die folgende Syntax verwenden, um Dezile eines Datensatzes in R zu berechnen:

 quantile(data, probs = seq (.1, .9, by = .1 ))

Das folgende Beispiel zeigt, wie Sie diese Funktion in der Praxis nutzen können.

Beispiel: Dezile in R berechnen

Der folgende Code zeigt, wie man einen gefälschten Datensatz mit 20 Werten erstellt und dann die Dezilwerte des Datensatzes berechnet:

 #create dataset
data <- c(56, 58, 64, 67, 68, 73, 78, 83, 84, 88,
          89, 90, 91, 92, 93, 93, 94, 95, 97, 99)

#calculate deciles of dataset
quantile(data, probs = seq (.1, .9, by = .1 ))

 10% 20% 30% 40% 50% 60% 70% 80% 90% 
63.4 67.8 76.5 83.6 88.5 90.4 92.3 93.2 95.2 

Dezile werden wie folgt interpretiert:

  • 10 % aller Datenwerte liegen unter 63,4
  • 20 % aller Datenwerte liegen unter 67,8 .
  • 30 % aller Datenwerte liegen unter 76,5 .
  • 40 % aller Datenwerte liegen unter 83,6 .
  • 50 % aller Datenwerte liegen unter 88,5 .
  • 60 % aller Datenwerte liegen unter 90,4 .
  • 70 % aller Datenwerte liegen unter 92,3 .
  • 80 % aller Datenwerte liegen unter 93,2 .
  • 90 % aller Datenwerte liegen unter 95,2 .

Es ist zu beachten, dass der Wert beim 50. Perzentil dem Medianwert des Datensatzes entspricht.

Beispiel: Werte in Dezilen in R platzieren

Um jeden Datenwert in einem Dezil zu platzieren, können wir die Funktion ntile(x, ngroups) aus dem dplyr- Paket in R verwenden.

So verwenden Sie diese Funktion für den Datensatz, den wir im vorherigen Beispiel erstellt haben:

 library (dplyr)

#create dataset
data <- data.frame(values=c(56, 58, 64, 67, 68, 73, 78, 83, 84, 88,
                            89, 90, 91, 92, 93, 93, 94, 95, 97, 99))

#place each value into a decile
data$decile <- ntile(data, 10)

#viewdata
data

   values decile
1 56 1
2 58 1
3 64 2
4 67 2
5 68 3
6 73 3
7 78 4
8 83 4
9 84 5
10 88 5
11 89 6
12 90 6
13 91 7
14 92 7
15 93 8
16 93 8
17 94 9
18 95 9
19 97 10
20 99 10

Das Ergebnis lässt sich wie folgt interpretieren:

  • Der Datenwert 56 liegt zwischen dem 0 %- und dem 10 %-Perzentil, also im ersten Dezil.
  • Der Datenwert 58 liegt zwischen dem 0 %- und 10 %-Perzentil, also im ersten Dezil.
  • Der Datenwert 64 liegt zwischen dem 10 %- und 20 %-Perzentil, also im zweiten Dezil.
  • Der Datenwert 67 liegt zwischen dem 10 %- und 20 %-Perzentil, also im zweiten Dezil.
  • Der Datenwert 68 liegt zwischen dem 20 %- und 30 %-Perzentil, also im dritten Dezil.

Und so weiter.

Zusätzliche Ressourcen

So berechnen Sie Perzentile in R
So berechnen Sie Quartile in R
So erstellen Sie Häufigkeitstabellen in R

Einen Kommentar hinzufügen

Deine E-Mail-Adresse wird nicht veröffentlicht. Erforderliche Felder sind mit * markiert