Jak policzyć unikalne wartości w kolumnie w r


Możesz użyć następujących metod, aby policzyć liczbę unikalnych wartości w kolumnie ramki danych w R:

Metoda 1: Użyj podstawy R

 length(unique(df$my_column))

Metoda 2: użyj dplyr

 library (dplyr)

n_distinct(df$my_column)

Poniższe przykłady pokazują, jak w praktyce zastosować każdą metodę z następującą ramką danych:

 #create data frame
df <- data. frame (team=c('A', 'A', 'A', 'A', 'B', 'B', 'C', 'C', 'D'),
                 points=c(10, 13, 14, 14, 18, 19, 20, 20, 22))

#view data frame
df

  team points
1 to 10
2 to 13
3 to 14
4 to 14
5 B 18
6 B 19
7 C 20
8 C 20
9 D 22

Metoda 1: Policz unikalne wartości w kolumnie za pomocą podstawy R

Poniższy kod pokazuje, jak policzyć liczbę unikalnych wartości w kolumnie punktowej ramki danych za pomocą funkcji bazowych R:

 #count unique values in points column
length(unique(df$points))

[1] 7

W kolumnie punktów znajduje się 7 unikalnych wartości.

Aby policzyć liczbę unikalnych wartości w każdej kolumnie ramki danych, możemy skorzystać z funkcji sapply() :

 #count unique values in each column
sapply(df, function (x) length(unique(x)))

  team points 
     4 7

Z wyniku możemy zobaczyć:

  • W kolumnie punktów znajduje się 7 unikalnych wartości.
  • W kolumnie zespołu znajdują się 4 unikalne wartości.

Metoda 2: Policz unikalne wartości w kolumnie za pomocą dplyr

Poniższy kod pokazuje, jak policzyć liczbę odrębnych wartości w kolumnie punktów za pomocą funkcji n_distinct() z pakietu dplyr:

 library (dplyr)

#count unique values in points column
n_distinct(df$points)

[1] 7

W kolumnie punktów znajduje się 7 unikalnych wartości.

Aby policzyć liczbę unikalnych wartości w każdej kolumnie ramki danych, możemy skorzystać z funkcji sapply() :

 library (dplyr)

#count unique values in each column
sapply(df, function (x) n_distinct(x))

  team points 
     4 7

Z wyniku możemy zobaczyć:

  • W kolumnie punktów znajduje się 7 unikalnych wartości.
  • W kolumnie zespołu znajdują się 4 unikalne wartości.

Należy zauważyć, że wyniki te odpowiadają wynikom podstawowej metody R.

Dodatkowe zasoby

Poniższe samouczki wyjaśniają, jak wykonywać inne typowe zadania w języku R:

Jak liczyć duplikaty w R
Jak policzyć unikalne wartości według grupy w R
Jak policzyć liczbę wartości NA w każdej kolumnie w R

Dodaj komentarz

Twój adres e-mail nie zostanie opublikowany. Wymagane pola są oznaczone *