Hoe het interkwartielbereik in r te berekenen (met voorbeelden)


Het interkwartielbereik vertegenwoordigt het verschil tussen het eerste kwartiel (het 25e percentiel) en het derde kwartiel (het 75e percentiel) van een dataset.

Simpel gezegd meet het de afwijking tussen de middelste 50% van de waarden.

IQR = Q3 – Q1

We kunnen de ingebouwde functie IQR() gebruiken om het interkwartielbereik van een reeks waarden in R te berekenen:

 IQR(x)

De volgende voorbeelden laten zien hoe u deze functie in de praktijk kunt gebruiken.

Voorbeeld 1: interkwartielbereik van een vector

De volgende code laat zien hoe u het interkwartielbereik van waarden in een vector kunt berekenen:

 #definevector
x <- c(4, 6, 6, 7, 8, 12, 15, 17, 20, 21, 21, 23, 24, 27, 28)

#calculate interquartile range of values in vector
IQR(x)

[1] 14.5

Voorbeeld 2: Interkwartielbereik van een vector met ontbrekende waarden

Als uw vector ontbrekende waarden heeft, zorg er dan voor dat u na.rm=TRUE specificeert om ontbrekende waarden te negeren bij het berekenen van het interkwartielbereik:

 #define vector with some missing values
x <- c(4, 6, NA, 7, NA, NA, 15, 17, 20, 21, 21, 23, 24, 27, 28)

#calculate interquartile range of values in vector
IQR(x, na. rm = TRUE )

[1] 10.25

Voorbeeld 3: Kolom-interkwartielbereik in een dataframe

De volgende code laat zien hoe u het interkwartielbereik voor een specifieke kolom in een dataframe kunt berekenen:

 #define data frame
df <- data. frame (var1=c(1, 3, 3, 4, 5),
                 var2=c(7, 7, 8, 3, 2),
                 var3=c(3, 3, 6, 6, 8),
                 var4=c(1, 1, 2, 8, 9))

#calculate interquartile range of 'var1' column
IQR(df$var1)

[1] 1

Voorbeeld 4: Interkwartielbereik van meerdere kolommen in een gegevensframe

De volgende code laat zien hoe u het interkwartielbereik van meerdere kolommen in een dataframe kunt berekenen:

 #define data frame
df <- data. frame (var1=c(1, 3, 3, 4, 5),
                 var2=c(7, 7, 8, 3, 2),
                 var3=c(3, 3, 6, 6, 8),
                 var4=c(1, 1, 2, 8, 9))

#calculate interquartile range of 'var1', 'var2', and 'var4' columns
sapply(df[, c(' var1 ', ' var2 ', ' var4 ')], IQR)

var1 var2 var4 
   1 4 7

Aanvullende bronnen

Hoe bereik te vinden in R
Hoe de standaardafwijking in R te berekenen
Hoe het interkwartielbereik te interpreteren
Interkwartielafstand en standaarddeviatie: wat is het verschil?

Einen Kommentar hinzufügen

Deine E-Mail-Adresse wird nicht veröffentlicht. Erforderliche Felder sind mit * markiert