Как посчитать уникальные значения в столбце в r


Вы можете использовать следующие методы для подсчета количества уникальных значений в столбце фрейма данных в R:

Метод 1: используйте базу R

 length(unique(df$my_column))

Способ 2: используйте dplyr

 library (dplyr)

n_distinct(df$my_column)

Следующие примеры показывают, как использовать каждый метод на практике со следующим фреймом данных:

 #create data frame
df <- data. frame (team=c('A', 'A', 'A', 'A', 'B', 'B', 'C', 'C', 'D'),
                 points=c(10, 13, 14, 14, 18, 19, 20, 20, 22))

#view data frame
df

  team points
1 to 10
2 to 13
3 to 14
4 to 14
5 B 18
6 B 19
7 C 20
8 C 20
9 D 22

Способ 1. Подсчитайте уникальные значения в столбце, используя базу R.

Следующий код показывает, как подсчитать количество уникальных значений в столбце точек фрейма данных с помощью базовых функций R:

 #count unique values in points column
length(unique(df$points))

[1] 7

В столбце баллов 7 уникальных значений.

Чтобы подсчитать количество уникальных значений в каждом столбце фрейма данных, мы можем использовать функцию sapply() :

 #count unique values in each column
sapply(df, function (x) length(unique(x)))

  team points 
     4 7

По результату мы видим:

  • В столбце баллов 7 уникальных значений.
  • В столбце команды есть 4 уникальных значения.

Способ 2: подсчитайте уникальные значения в столбце с помощью dplyr

Следующий код показывает, как подсчитать количество различных значений в столбце точек с помощью функции n_distinct() из пакета dplyr:

 library (dplyr)

#count unique values in points column
n_distinct(df$points)

[1] 7

В столбце баллов 7 уникальных значений.

Чтобы подсчитать количество уникальных значений в каждом столбце фрейма данных, мы можем использовать функцию sapply() :

 library (dplyr)

#count unique values in each column
sapply(df, function (x) n_distinct(x))

  team points 
     4 7

По результату мы видим:

  • В столбце баллов 7 уникальных значений.
  • В столбце команды есть 4 уникальных значения.

Обратите внимание, что эти результаты совпадают с результатами базового метода R.

Дополнительные ресурсы

В следующих руководствах объясняется, как выполнять другие распространенные задачи в R:

Как посчитать дубликаты в R
Как посчитать уникальные значения по группам в R
Как посчитать количество значений NA в каждом столбце в R

Добавить комментарий

Ваш адрес email не будет опубликован. Обязательные поля помечены *