Как посчитать уникальные значения в столбце в r
Вы можете использовать следующие методы для подсчета количества уникальных значений в столбце фрейма данных в R:
Метод 1: используйте базу R
length(unique(df$my_column))
Способ 2: используйте dplyr
library (dplyr)
n_distinct(df$my_column)
Следующие примеры показывают, как использовать каждый метод на практике со следующим фреймом данных:
#create data frame
df <- data. frame (team=c('A', 'A', 'A', 'A', 'B', 'B', 'C', 'C', 'D'),
points=c(10, 13, 14, 14, 18, 19, 20, 20, 22))
#view data frame
df
team points
1 to 10
2 to 13
3 to 14
4 to 14
5 B 18
6 B 19
7 C 20
8 C 20
9 D 22
Способ 1. Подсчитайте уникальные значения в столбце, используя базу R.
Следующий код показывает, как подсчитать количество уникальных значений в столбце точек фрейма данных с помощью базовых функций R:
#count unique values in points column
length(unique(df$points))
[1] 7
В столбце баллов 7 уникальных значений.
Чтобы подсчитать количество уникальных значений в каждом столбце фрейма данных, мы можем использовать функцию sapply() :
#count unique values in each column
sapply(df, function (x) length(unique(x)))
team points
4 7
По результату мы видим:
- В столбце баллов 7 уникальных значений.
- В столбце команды есть 4 уникальных значения.
Способ 2: подсчитайте уникальные значения в столбце с помощью dplyr
Следующий код показывает, как подсчитать количество различных значений в столбце точек с помощью функции n_distinct() из пакета dplyr:
library (dplyr)
#count unique values in points column
n_distinct(df$points)
[1] 7
В столбце баллов 7 уникальных значений.
Чтобы подсчитать количество уникальных значений в каждом столбце фрейма данных, мы можем использовать функцию sapply() :
library (dplyr)
#count unique values in each column
sapply(df, function (x) n_distinct(x))
team points
4 7
По результату мы видим:
- В столбце баллов 7 уникальных значений.
- В столбце команды есть 4 уникальных значения.
Обратите внимание, что эти результаты совпадают с результатами базового метода R.
Дополнительные ресурсы
В следующих руководствах объясняется, как выполнять другие распространенные задачи в R:
Как посчитать дубликаты в R
Как посчитать уникальные значения по группам в R
Как посчитать количество значений NA в каждом столбце в R