Hoe bereik in r te vinden (met voorbeelden)
Bereik is het verschil tussen de grootste en kleinste waarde in een dataset.
We kunnen de volgende syntaxis gebruiken om het bereik van een gegevensset in R te vinden:
data <- c(1, 3, NA, 5, 16, 18, 22, 25, 29) #calculate range max(data, na. rm = TRUE ) - min(data, na. rm = TRUE ) [1] 28
En we kunnen de functie range() in basis R gebruiken om de kleinste en grootste waarden in de dataset weer te geven:
data <- c(1, 3, NA, 5, 16, 18, 22, 25, 29) #calculate range values range(data, na. rm = TRUE ) [1] 1 29
Deze tutorial toont verschillende voorbeelden van het berekenen van het bereik van datasets in R.
Gerelateerd: Verspreidingsmaten in de statistiek
Voorbeeld 1: Bereken het bereik van een enkele variabele
De volgende code laat zien hoe u het bereik van een enkele variabele in R kunt berekenen:
#create data frame df <- data. frame (x=c(1, 3, NA, 5, 16, 18, 22, 25), y=c(NA, 4, 8, 9, 14, 23, 29, 31), z=c(2, NA, 9, 4, 13, 17, 22, 24)) #find range of variable x in the data frame max(df$x, na. rm = TRUE ) - min(df$x, na. rm = TRUE ) [1] 24
Voorbeeld 2: Bereken het bereik van meerdere variabelen
De volgende code laat zien hoe u het bereik van meerdere variabelen in R kunt berekenen:
#create data frame df <- data. frame (x=c(1, 3, NA, 5, 16, 18, 22, 25), y=c(NA, 4, 8, 9, 14, 23, 29, 31), z=c(2, NA, 9, 4, 13, 17, 22, 24)) #find range of variable x and y in the data frame sapply(df[c(' x ',' y ')], function (df) max(df, na.rm= TRUE ) - min(df, na.rm= TRUE )) xy 24 27 #find range of all variables in the data frame sapply(df, function (df) max(df, na.rm= TRUE ) - min(df, na.rm= TRUE )) X Y Z 24 27 22
Een gids voor apply(), lapply() , sapply() en tapply() in R
Voorbeeld 3: Bereken het bereik van het gehele dataframe
De volgende code laat zien hoe u het bereik van alle waarden in een dataframe kunt berekenen:
#create data frame df <- data.frame(x=c(1, 3, NA, 5, 16, 18, 22, 25), y=c(NA, 4, 8, 9, 14, 23, 29, 31), z=c(2, NA, 9, 4, 13, 17, 22, 24)) #find range of all values in entire data frame max(df, na.rm= TRUE ) - min(df, na.rm= TRUE ) [1] 30
In dit voorbeeld bleek het bereik van het gehele datablok 31 – 1 = 30 te zijn.
Aanvullende bronnen
In de volgende tutorials wordt uitgelegd hoe u andere veelvoorkomende taken in R kunt uitvoeren:
Hoe het interkwartielbereik in R te berekenen
Hoe de standaardafwijking in R te berekenen
Hoe percentielen in R te berekenen