A: как найти уникальные значения и отсортировать их


Вы можете использовать следующие методы для поиска уникальных значений и их последующей сортировки в R:

Способ 1: найти уникальные значения в векторе и отсортировать их

 #get unique values sorted in ascending order
sort(unique(data))

Способ 2. Найдите уникальные строки во фрейме данных и отсортируйте их.

 #remove duplicate rows in data frame
df_new = df[!duplicated(df), ]

#display unique rows sorted by values in specific column
df_new = df_new[order(df_new$my_column), ]

Следующие примеры показывают, как использовать каждый метод на практике.

Пример 1. Найдите уникальные значения в векторе и отсортируйте их

Предположим, у нас есть следующий вектор в R:

 #create vector of values
data <- c(2, 2, 4, 7, 2, 4, 14, 7, 10, 7)

Мы можем использовать следующий синтаксис, чтобы найти уникальные значения в векторе и отсортировать их:

 #get unique values sorted in ascending order
sort(unique(data))

[1] 2 4 7 10 14

Обратите внимание, что уникальные значения вектора возвращаются в порядке возрастания.

Мы также можем использовать аргумент по убыванию=ИСТИНА для сортировки уникальных значений в порядке убывания:

 #get unique values sorted in descending order
sort(unique(data), decreasing= TRUE )

[1] 14 10 7 4 2

Обратите внимание, что уникальные значения вектора возвращаются в порядке убывания.

Пример 2. Найдите уникальные значения во фрейме данных и отсортируйте их.

Предположим, у нас есть следующий кадр данных в R:

 #create data frame
df <- data. frame (team=c('A', 'B', 'A', 'A', 'A', 'B', 'B', 'B', 'A', 'B'),
                 points=c(2, 10, 7, 7, 2, 4, 14, 7, 2, 7))

#view data frame
df

   team points
1 TO 2
2 B 10
3 to 7
4 to 7
5 to 2
6 B 4
7 B 14
8 B 7
9 to 2
10 B 7

Мы можем использовать следующий синтаксис, чтобы найти уникальные строки во фрейме данных и отсортировать их на основе значений столбца команды :

 #remove duplicate rows in data frame
df_new = df[ ! duplicated(df), ]

#sort unique rows based on values in team column
df_new = df_new[order(df_new$team, df_new$points), ]

#view new data frame
df_new

  team points
1 TO 2
3 to 7
2 B 4
6 B 7
7 B 10
8 B 14

Обратите внимание, что уникальные строки возвращаются и сортируются на основе значений в столбце «Команда» , а затем значений в столбце «Очки» .

Как использовать sort(), order() и Rank() в R

Дополнительные ресурсы

В следующих руководствах объясняется, как выполнять другие распространенные операции в R:

Как посчитать уникальные значения в столбце в R
Как выбрать отдельные строки во фрейме данных в R
Как найти все уникальные комбинации двух векторов в R

Добавить комментарий

Ваш адрес email не будет опубликован. Обязательные поля помечены *