Как вычислить сумму пяти чисел в r (с примерами)


Пятизначное резюме — это способ суммирования набора данных с использованием следующих пяти значений:

  • Минимум
  • Первый квартиль
  • Медиана
  • Третий квартиль
  • Максимум

Сводка из пяти цифр полезна, поскольку она дает краткую информацию о распределении данных следующим образом:

  • Он сообщает нам, где находится медианное значение , используя медиану.
  • Он сообщает нам распределение данных, используя первый и третий квартили.
  • Он сообщает нам диапазон данных, используя минимум и максимум.

Самый простой способ вычислить пятизначную сводку набора данных в R — использовать функцию Fivenum() из базы R:

 fivenum(data)

В следующем примере показано, как использовать этот синтаксис на практике.

Пример 1: Пятизначная сводка вектора

Следующий код показывает, как вычислить пятизначную сводку числового вектора в R:

 #define numeric vector
data <- c(4, 6, 6, 7, 8, 9, 12, 13, 14, 15, 15, 18, 22)

#calculate five number summary of data
fivenum(data)

[1] 4 7 12 15 22

По результату мы видим:

  • Минимум: 4
  • Первый квартиль: 7
  • Медиана: 12
  • Третий квартиль: 15
  • Максимум: 22

Мы можем быстро визуализировать пятизначное резюме, создав коробчатую диаграмму:

 boxplot(data)

[1] 4 7 12 15 22 

Вот как интерпретировать коробчатый график:

  • Линия внизу графика представляет минимальное значение ( 4 ).
  • Линия внизу поля представляет первый квартиль ( 7 ).
  • Линия в середине прямоугольника представляет медиану ( 12 ).
  • Линия в верхней части поля представляет собой третий квартиль ( 15 ).
  • Линия в верхней части графика представляет максимальное значение ( 22 ).

Пример 2. Пятизначная сводка столбца во фрейме данных.

Следующий код показывает, как вычислить пятизначную сводку определенного столбца во фрейме данных:

 #create data frame
df <- data. frame (team=c('A', 'B', 'C', 'D', 'E', 'F', 'G', 'H'),
                 points=c(99, 90, 86, 88, 95, 87, 85, 89),
                 assists=c(33, 28, 31, 39, 34, 30, 29, 25),
                 rebounds=c(30, 28, 24, 24, 28, 30, 31, 35))

#calculate five number summary of points column
fivenum(df$points)

[1] 85.0 86.5 88.5 92.5 99.0

Пример 3. Пятизначная сводка по нескольким столбцам.

Следующий код показывает, как использовать функцию sapply() для одновременного расчета пятизначной сводки нескольких столбцов во фрейме данных:

 #create data frame
df <- data. frame (team=c('A', 'B', 'C', 'D', 'E', 'F', 'G', 'H'),
                 points=c(99, 90, 86, 88, 95, 87, 85, 89),
                 assists=c(33, 28, 31, 39, 34, 30, 29, 25),
                 rebounds=c(30, 28, 24, 24, 28, 30, 31, 35))

#calculate five number summary of points, assists, and rebounds column
sapply(df[c(' points ', ' assists ', ' rebounds ')], fivenum)

     points assists rebounds
[1,] 85.0 25.0 24.0
[2,] 86.5 28.5 26.0
[3,] 88.5 30.5 29.0
[4,] 92.5 33.5 30.5
[5,] 99.0 39.0 35.0

Связанный: Руководство по применению(), lapply(), sapply() и Tapply() в R.

Дополнительные ресурсы

Как создать сводные таблицы в R
Как найти диапазон в R
Как удалить выбросы в R

Добавить комментарий

Ваш адрес email не будет опубликован. Обязательные поля помечены *