So berechnen sie den interquartilbereich in r (mit beispielen)


Der Interquartilbereich stellt die Differenz zwischen dem ersten Quartil (dem 25. Perzentil) und dem dritten Quartil (dem 75. Perzentil) eines Datensatzes dar.

Vereinfacht ausgedrückt misst es die Abweichung zwischen den mittleren 50 % der Werte.

IQR = Q3 – Q1

Wir können die integrierte Funktion IQR() verwenden, um den Interquartilbereich einer Reihe von Werten in R zu berechnen:

 IQR(x)

Die folgenden Beispiele zeigen, wie Sie diese Funktion in der Praxis nutzen können.

Beispiel 1: Interquartilbereich eines Vektors

Der folgende Code zeigt, wie der Interquartilbereich von Werten in einem Vektor berechnet wird:

 #definevector
x <- c(4, 6, 6, 7, 8, 12, 15, 17, 20, 21, 21, 23, 24, 27, 28)

#calculate interquartile range of values in vector
IQR(x)

[1] 14.5

Beispiel 2: Interquartilbereich eines Vektors mit fehlenden Werten

Wenn Ihr Vektor fehlende Werte aufweist, geben Sie unbedingt na.rm=TRUE an, um fehlende Werte bei der Berechnung des Interquartilbereichs zu ignorieren:

 #define vector with some missing values
x <- c(4, 6, NA, 7, NA, NA, 15, 17, 20, 21, 21, 23, 24, 27, 28)

#calculate interquartile range of values in vector
IQR(x, na. rm = TRUE )

[1] 10.25

Beispiel 3: Interquartilbereich der Spalte in einem Datenrahmen

Der folgende Code zeigt, wie der Interquartilbereich für eine bestimmte Spalte in einem Datenrahmen berechnet wird:

 #define data frame
df <- data. frame (var1=c(1, 3, 3, 4, 5),
                 var2=c(7, 7, 8, 3, 2),
                 var3=c(3, 3, 6, 6, 8),
                 var4=c(1, 1, 2, 8, 9))

#calculate interquartile range of 'var1' column
IQR(df$var1)

[1] 1

Beispiel 4: Interquartilbereich mehrerer Spalten in einem Datenrahmen

Der folgende Code zeigt, wie der Interquartilbereich mehrerer Spalten in einem Datenrahmen berechnet wird:

 #define data frame
df <- data. frame (var1=c(1, 3, 3, 4, 5),
                 var2=c(7, 7, 8, 3, 2),
                 var3=c(3, 3, 6, 6, 8),
                 var4=c(1, 1, 2, 8, 9))

#calculate interquartile range of 'var1', 'var2', and 'var4' columns
sapply(df[, c(' var1 ', ' var2 ', ' var4 ')], IQR)

var1 var2 var4 
   1 4 7

Zusätzliche Ressourcen

So finden Sie den Bereich in R
So berechnen Sie die Standardabweichung in R
Wie ist der Interquartilbereich zu interpretieren?
Interquartilbereich und Standardabweichung: Was ist der Unterschied?

Einen Kommentar hinzufügen

Deine E-Mail-Adresse wird nicht veröffentlicht. Erforderliche Felder sind mit * markiert