R : Comment trouver des valeurs uniques dans une colonne
Vous pouvez utiliser la fonction unique() dans R pour rechercher des valeurs uniques dans une colonne d’un bloc de données.
Ce didacticiel fournit plusieurs exemples d’utilisation de cette fonction avec le bloc de données suivant :
#create data frame
df <- data.frame(team=c('A', 'A', 'B', 'B', 'C', 'C'),
points=c(90, 99, 90, 85, 90, 85),
assists=c(33, 33, 31, 39, 34, 34),
rebounds=c(30, 28, 24, 24, 28, 28))
#view data frame
df
team points assists rebounds
1 A 90 33 30
2 A 99 33 28
3 B 90 31 24
4 B 85 39 24
5 C 90 34 28
6 C 85 34 28
Exemple 1 : Rechercher des valeurs uniques dans une colonne
Le code suivant montre comment trouver des valeurs uniques dans la colonne « équipe » :
#find unique values in 'team' column
unique(df$team)
[1] "A" "B" "C"
Nous pouvons utiliser une syntaxe similaire pour trouver des valeurs uniques dans la colonne « points » :
#find unique values in 'points' column
unique(df$points)
[1] 90 99 85
Exemple 2 : rechercher et trier des valeurs uniques dans une colonne
Le code suivant montre comment rechercher et trier des valeurs uniques dans la colonne « points » :
#find and sort unique values in 'points' column
sort(unique(df$points))
[1] 85 90 99
Nous pouvons également trier les valeurs uniques par ordre décroissant :
#find and sort unique values in 'points' column
sort(unique(df$points), decreasing=TRUE)
[1] 99 90 85
Exemple 3 : Rechercher et compter les valeurs uniques dans la colonne
Le code suivant montre comment trouver et compter le nombre de chaque valeur unique dans la colonne « points » :
#find and count unique values in 'points' column
table(df$points)
85 90 99
2 3 1
À partir du résultat, nous pouvons voir :
- La valeur 85 apparaît 2 fois.
- La valeur 90 apparaît 3 fois.
- La valeur 99 apparaît 1 fois.
Ressources additionnelles
Les didacticiels suivants expliquent comment effectuer d’autres opérations courantes dans R :
Comment exécuter une fonction COUNTIF dans R
Comment trouver et compter les valeurs manquantes dans R
Comment compter le nombre d’occurrences dans les colonnes de R