Jak policzyć unikalne wartości w kolumnie w r
Możesz użyć następujących metod, aby policzyć liczbę unikalnych wartości w kolumnie ramki danych w R:
Metoda 1: Użyj podstawy R
length(unique(df$my_column))
Metoda 2: użyj dplyr
library (dplyr)
n_distinct(df$my_column)
Poniższe przykłady pokazują, jak w praktyce zastosować każdą metodę z następującą ramką danych:
#create data frame
df <- data. frame (team=c('A', 'A', 'A', 'A', 'B', 'B', 'C', 'C', 'D'),
points=c(10, 13, 14, 14, 18, 19, 20, 20, 22))
#view data frame
df
team points
1 to 10
2 to 13
3 to 14
4 to 14
5 B 18
6 B 19
7 C 20
8 C 20
9 D 22
Metoda 1: Policz unikalne wartości w kolumnie za pomocą podstawy R
Poniższy kod pokazuje, jak policzyć liczbę unikalnych wartości w kolumnie punktowej ramki danych za pomocą funkcji bazowych R:
#count unique values in points column
length(unique(df$points))
[1] 7
W kolumnie punktów znajduje się 7 unikalnych wartości.
Aby policzyć liczbę unikalnych wartości w każdej kolumnie ramki danych, możemy skorzystać z funkcji sapply() :
#count unique values in each column
sapply(df, function (x) length(unique(x)))
team points
4 7
Z wyniku możemy zobaczyć:
- W kolumnie punktów znajduje się 7 unikalnych wartości.
- W kolumnie zespołu znajdują się 4 unikalne wartości.
Metoda 2: Policz unikalne wartości w kolumnie za pomocą dplyr
Poniższy kod pokazuje, jak policzyć liczbę odrębnych wartości w kolumnie punktów za pomocą funkcji n_distinct() z pakietu dplyr:
library (dplyr)
#count unique values in points column
n_distinct(df$points)
[1] 7
W kolumnie punktów znajduje się 7 unikalnych wartości.
Aby policzyć liczbę unikalnych wartości w każdej kolumnie ramki danych, możemy skorzystać z funkcji sapply() :
library (dplyr)
#count unique values in each column
sapply(df, function (x) n_distinct(x))
team points
4 7
Z wyniku możemy zobaczyć:
- W kolumnie punktów znajduje się 7 unikalnych wartości.
- W kolumnie zespołu znajdują się 4 unikalne wartości.
Należy zauważyć, że wyniki te odpowiadają wynikom podstawowej metody R.
Dodatkowe zasoby
Poniższe samouczki wyjaśniają, jak wykonywać inne typowe zadania w języku R:
Jak liczyć duplikaty w R
Jak policzyć unikalne wartości według grupy w R
Jak policzyć liczbę wartości NA w każdej kolumnie w R