Hoe unieke waarden in een kolom in r te tellen


U kunt de volgende methoden gebruiken om het aantal unieke waarden in een kolom van een dataframe in R te tellen:

Methode 1: Gebruik Base R

 length(unique(df$my_column))

Methode 2: gebruik dplyr

 library (dplyr)

n_distinct(df$my_column)

De volgende voorbeelden laten zien hoe u elke methode in de praktijk kunt gebruiken met het volgende dataframe:

 #create data frame
df <- data. frame (team=c('A', 'A', 'A', 'A', 'B', 'B', 'C', 'C', 'D'),
                 points=c(10, 13, 14, 14, 18, 19, 20, 20, 22))

#view data frame
df

  team points
1 to 10
2 to 13
3 to 14
4 to 14
5 B 18
6 B 19
7 C 20
8 C 20
9 D 22

Methode 1: Tel unieke waarden in de kolom met behulp van R-basis

De volgende code laat zien hoe u het aantal unieke waarden in de puntkolom van het dataframe kunt tellen met behulp van R-basisfuncties:

 #count unique values in points column
length(unique(df$points))

[1] 7

Er zijn 7 unieke waarden in de puntenkolom .

Om het aantal unieke waarden in elke kolom van het dataframe te tellen, kunnen we de functie sapply() gebruiken:

 #count unique values in each column
sapply(df, function (x) length(unique(x)))

  team points 
     4 7

Uit het resultaat kunnen we zien:

  • Er zijn 7 unieke waarden in de puntenkolom .
  • Er zijn 4 unieke waarden in de teamkolom .

Methode 2: Tel unieke waarden in de kolom met behulp van dplyr

De volgende code laat zien hoe je het aantal verschillende waarden in de puntenkolom kunt tellen met behulp van de functie n_distinct() uit het dplyr-pakket:

 library (dplyr)

#count unique values in points column
n_distinct(df$points)

[1] 7

Er zijn 7 unieke waarden in de puntenkolom .

Om het aantal unieke waarden in elke kolom van het dataframe te tellen, kunnen we de functie sapply() gebruiken:

 library (dplyr)

#count unique values in each column
sapply(df, function (x) n_distinct(x))

  team points 
     4 7

Uit het resultaat kunnen we zien:

  • Er zijn 7 unieke waarden in de puntenkolom .
  • Er zijn 4 unieke waarden in de teamkolom .

Merk op dat deze resultaten overeenkomen met die van de basis R-methode.

Aanvullende bronnen

In de volgende tutorials wordt uitgelegd hoe u andere veelvoorkomende taken in R kunt uitvoeren:

Hoe duplicaten te tellen in R
Hoe unieke waarden per groep te tellen in R
Hoe het aantal NA-waarden in elke kolom in R te tellen

Einen Kommentar hinzufügen

Deine E-Mail-Adresse wird nicht veröffentlicht. Erforderliche Felder sind mit * markiert