Comment sélectionner uniquement les colonnes numériques dans R à l’aide de dplyr
Vous pouvez utiliser la fonction suivante du package dplyr pour sélectionner uniquement les colonnes numériques d’un bloc de données dans R :
df %>% select(where(is.numeric))
L’exemple suivant montre comment utiliser cette fonction dans la pratique.
Exemple : sélectionner uniquement les colonnes numériques à l’aide de dplyr
Supposons que nous ayons le bloc de données suivant dans R qui contient des informations sur divers joueurs de basket-ball :
#create data frame df <- data.frame(team=c('A', 'B', 'C', 'D', 'E'), points=c(22, 34, 30, 12, 18), assists=c(7, 9, 9, 12, 14), rebounds=c(5, 10, 10, 8, 8)) #view data frame df team points assists rebounds 1 A 22 7 5 2 B 34 9 10 3 C 30 9 10 4 D 12 12 8 5 E 18 14 8
Nous pouvons utiliser la syntaxe suivante pour sélectionner uniquement les colonnes numériques du bloc de données :
library(dplyr)
#select only the numeric columns from the data frame
df %>% select(where(is.numeric))
points assists rebounds
1 22 7 5
2 34 9 10
3 30 9 10
4 12 12 8
5 18 14 8
Notez que seules les trois colonnes numériques ont été sélectionnées – points , passes décisives et rebonds .
Nous pouvons vérifier que ces colonnes sont numériques en utilisant la fonction str() pour afficher le type de données de chaque variable dans le bloc de données :
#display data type of each variable in data frame
str(df)
'data.frame': 5 obs. of 4 variables:
$ team : chr "A" "B" "C" "D" ...
$ points : num 22 34 30 12 18
$ assists : num 7 9 9 12 14
$ rebounds: num 5 10 10 8 8
D’après le résultat, nous pouvons voir que l’équipe est une variable de caractère tandis que les points , les passes décisives et les rebonds sont tous numériques.
Connexe : Comment vérifier le type de données dans R (avec des exemples)
Ressources additionnelles
Les didacticiels suivants expliquent comment effectuer d’autres tâches courantes à l’aide de dplyr :
Comment sélectionner des colonnes par nom à l’aide de dplyr
Comment sélectionner des colonnes par index à l’aide de dplyr
Comment utiliser select_if avec plusieurs conditions dans dplyr