Как найти диапазон в r (с примерами)


Диапазон — это разница между наибольшим и наименьшим значением в наборе данных.

Мы можем использовать следующий синтаксис, чтобы найти диапазон набора данных в R:

 data <- c(1, 3, NA, 5, 16, 18, 22, 25, 29)

#calculate range
max(data, na. rm = TRUE ) - min(data, na. rm = TRUE )

[1] 28

И мы можем использовать функцию range() в базе R для отображения наименьших и наибольших значений в наборе данных:

 data <- c(1, 3, NA, 5, 16, 18, 22, 25, 29)

#calculate range values
range(data, na. rm = TRUE )

[1] 1 29

В этом руководстве показано несколько примеров расчета диапазона наборов данных в R.

Связанный: Меры дисперсии в статистике

Пример 1. Вычисление диапазона одной переменной

Следующий код показывает, как вычислить диапазон одной переменной в R:

 #create data frame
df <- data. frame (x=c(1, 3, NA, 5, 16, 18, 22, 25),
                 y=c(NA, 4, 8, 9, 14, 23, 29, 31),
                 z=c(2, NA, 9, 4, 13, 17, 22, 24))

#find range of variable x in the data frame
max(df$x, na. rm = TRUE ) - min(df$x, na. rm = TRUE )

[1] 24

Пример 2. Вычисление диапазона нескольких переменных

Следующий код показывает, как вычислить диапазон нескольких переменных в R:

 #create data frame
df <- data. frame (x=c(1, 3, NA, 5, 16, 18, 22, 25),
                 y=c(NA, 4, 8, 9, 14, 23, 29, 31),
                 z=c(2, NA, 9, 4, 13, 17, 22, 24))

#find range of variable x and y in the data frame
sapply(df[c(' x ',' y ')], function (df) max(df, na.rm= TRUE ) - min(df, na.rm= TRUE ))

 xy
24 27 

#find range of all variables in the data frame
sapply(df, function (df) max(df, na.rm= TRUE ) - min(df, na.rm= TRUE ))

 X Y Z
24 27 22 

Руководство по применению(), lapply() , sapply() и Tapply() в R

Пример 3. Вычисление диапазона всего фрейма данных.

Следующий код показывает, как вычислить диапазон всех значений во фрейме данных:

 #create data frame
df <- data.frame(x=c(1, 3, NA, 5, 16, 18, 22, 25),
                 y=c(NA, 4, 8, 9, 14, 23, 29, 31),
                 z=c(2, NA, 9, 4, 13, 17, 22, 24))

#find range of all values in entire data frame
max(df, na.rm= TRUE ) - min(df, na.rm= TRUE )

[1] 30

В этом примере диапазон всего блока данных оказался 31 — 1 = 30 .

Дополнительные ресурсы

В следующих руководствах объясняется, как выполнять другие распространенные задачи в R:

Как рассчитать межквартильный размах в R
Как рассчитать стандартное отклонение в R
Как рассчитать процентили в R

Добавить комментарий

Ваш адрес email не будет опубликован. Обязательные поля помечены *