Como iterar por nomes de colunas em r (com exemplos)
Freqüentemente, você pode querer iterar pelos nomes das colunas de um quadro de dados em R e realizar determinadas operações em cada coluna. Existem duas maneiras comuns de fazer isso:
Método 1: use um loop For
for (i in colnames(df)){ some operation }
Método 2: use sapply()
sapply(df, some operation )
Este tutorial mostra um exemplo de como usar cada um desses métodos na prática.
Método 1: use um loop For
O código a seguir mostra como percorrer os nomes das colunas de um quadro de dados usando um loop for e exibir o valor médio de cada coluna:
#create data frame df <- data.frame(var1=c(1, 3, 3, 4, 5), var2=c(7, 7, 8, 3, 2), var3=c(3, 3, 6, 6, 8), var4=c(1, 1, 2, 8, 9)) #view data frame df var1 var2 var3 var4 1 1 7 3 1 2 3 7 3 1 3 3 8 6 2 4 4 3 6 8 5 5 2 8 9 #loop through each column and print mean of column for (i in colnames(df)){ print( mean (df[[i]])) } [1] 3.2 [1] 5.4 [1] 5.2 [1] 4.2
Método 2: use sapply()
O código a seguir mostra como iterar pelos nomes das colunas de um quadro de dados usando sapply() e exibir o valor médio de cada coluna:
#create data frame df <- data.frame(var1=c(1, 3, 3, 4, 5), var2=c(7, 7, 8, 3, 2), var3=c(3, 3, 6, 6, 8), var4=c(1, 1, 2, 8, 9)) #view data frame df var1 var2 var3 var4 1 1 7 3 1 2 3 7 3 1 3 3 8 6 2 4 4 3 6 8 5 5 2 8 9 #loop through each column and print mean of column sapply(df, mean ) var1 var2 var3 var4 3.2 5.4 5.2 4.2
Observe que ambos os métodos retornam resultados idênticos.
Relacionado: Um guia para apply(), lapply(), sapply() e tapply() em R