Comment parcourir les noms de colonnes dans R (avec exemples)
Souvent, vous souhaiterez peut-être parcourir les noms de colonnes d’un bloc de données dans R et effectuer certaines opérations sur chaque colonne. Il existe deux manières courantes de procéder :
Méthode 1 : utiliser une boucle For
for (i in colnames(df)){ some operation }
Méthode 2 : utilisez sapply()
sapply(df, some operation)
Ce didacticiel montre un exemple d’utilisation pratique de chacune de ces méthodes.
Méthode 1 : utiliser une boucle For
Le code suivant montre comment parcourir les noms de colonnes d’un bloc de données à l’aide d’une boucle for et afficher la valeur moyenne de chaque colonne :
#create data frame df <- data.frame(var1=c(1, 3, 3, 4, 5), var2=c(7, 7, 8, 3, 2), var3=c(3, 3, 6, 6, 8), var4=c(1, 1, 2, 8, 9)) #view data frame df var1 var2 var3 var4 1 1 7 3 1 2 3 7 3 1 3 3 8 6 2 4 4 3 6 8 5 5 2 8 9 #loop through each column and print mean of column for (i in colnames(df)){ print(mean(df[[i]])) } [1] 3.2 [1] 5.4 [1] 5.2 [1] 4.2
Méthode 2 : utilisez sapply()
Le code suivant montre comment parcourir les noms de colonnes d’un bloc de données à l’aide de sapply() et afficher la valeur moyenne de chaque colonne :
#create data frame df <- data.frame(var1=c(1, 3, 3, 4, 5), var2=c(7, 7, 8, 3, 2), var3=c(3, 3, 6, 6, 8), var4=c(1, 1, 2, 8, 9)) #view data frame df var1 var2 var3 var4 1 1 7 3 1 2 3 7 3 1 3 3 8 6 2 4 4 3 6 8 5 5 2 8 9 #loop through each column and print mean of column sapply(df, mean) var1 var2 var3 var4 3.2 5.4 5.2 4.2
Notez que les deux méthodes renvoient des résultats identiques.
Connexe : Un guide pour apply(), lapply(), sapply() et tapply() dans R