Hoe bereik in r te vinden (met voorbeelden)


Bereik is het verschil tussen de grootste en kleinste waarde in een dataset.

We kunnen de volgende syntaxis gebruiken om het bereik van een gegevensset in R te vinden:

 data <- c(1, 3, NA, 5, 16, 18, 22, 25, 29)

#calculate range
max(data, na. rm = TRUE ) - min(data, na. rm = TRUE )

[1] 28

En we kunnen de functie range() in basis R gebruiken om de kleinste en grootste waarden in de dataset weer te geven:

 data <- c(1, 3, NA, 5, 16, 18, 22, 25, 29)

#calculate range values
range(data, na. rm = TRUE )

[1] 1 29

Deze tutorial toont verschillende voorbeelden van het berekenen van het bereik van datasets in R.

Gerelateerd: Verspreidingsmaten in de statistiek

Voorbeeld 1: Bereken het bereik van een enkele variabele

De volgende code laat zien hoe u het bereik van een enkele variabele in R kunt berekenen:

 #create data frame
df <- data. frame (x=c(1, 3, NA, 5, 16, 18, 22, 25),
                 y=c(NA, 4, 8, 9, 14, 23, 29, 31),
                 z=c(2, NA, 9, 4, 13, 17, 22, 24))

#find range of variable x in the data frame
max(df$x, na. rm = TRUE ) - min(df$x, na. rm = TRUE )

[1] 24

Voorbeeld 2: Bereken het bereik van meerdere variabelen

De volgende code laat zien hoe u het bereik van meerdere variabelen in R kunt berekenen:

 #create data frame
df <- data. frame (x=c(1, 3, NA, 5, 16, 18, 22, 25),
                 y=c(NA, 4, 8, 9, 14, 23, 29, 31),
                 z=c(2, NA, 9, 4, 13, 17, 22, 24))

#find range of variable x and y in the data frame
sapply(df[c(' x ',' y ')], function (df) max(df, na.rm= TRUE ) - min(df, na.rm= TRUE ))

 xy
24 27 

#find range of all variables in the data frame
sapply(df, function (df) max(df, na.rm= TRUE ) - min(df, na.rm= TRUE ))

 X Y Z
24 27 22 

Een gids voor apply(), lapply() , sapply() en tapply() in R

Voorbeeld 3: Bereken het bereik van het gehele dataframe

De volgende code laat zien hoe u het bereik van alle waarden in een dataframe kunt berekenen:

 #create data frame
df <- data.frame(x=c(1, 3, NA, 5, 16, 18, 22, 25),
                 y=c(NA, 4, 8, 9, 14, 23, 29, 31),
                 z=c(2, NA, 9, 4, 13, 17, 22, 24))

#find range of all values in entire data frame
max(df, na.rm= TRUE ) - min(df, na.rm= TRUE )

[1] 30

In dit voorbeeld bleek het bereik van het gehele datablok 31 – 1 = 30 te zijn.

Aanvullende bronnen

In de volgende tutorials wordt uitgelegd hoe u andere veelvoorkomende taken in R kunt uitvoeren:

Hoe het interkwartielbereik in R te berekenen
Hoe de standaardafwijking in R te berekenen
Hoe percentielen in R te berekenen

Einen Kommentar hinzufügen

Deine E-Mail-Adresse wird nicht veröffentlicht. Erforderliche Felder sind mit * markiert