Como iterar por nomes de colunas em r (com exemplos)


Freqüentemente, você pode querer iterar pelos nomes das colunas de um quadro de dados em R e realizar determinadas operações em cada coluna. Existem duas maneiras comuns de fazer isso:

Método 1: use um loop For

 for (i in colnames(df)){
   some operation
}

Método 2: use sapply()

 sapply(df, some operation )

Este tutorial mostra um exemplo de como usar cada um desses métodos na prática.

Método 1: use um loop For

O código a seguir mostra como percorrer os nomes das colunas de um quadro de dados usando um loop for e exibir o valor médio de cada coluna:

 #create data frame
df <- data.frame(var1=c(1, 3, 3, 4, 5),
                 var2=c(7, 7, 8, 3, 2),
                 var3=c(3, 3, 6, 6, 8),
                 var4=c(1, 1, 2, 8, 9))

#view data frame
df

  var1 var2 var3 var4
1 1 7 3 1
2 3 7 3 1
3 3 8 6 2
4 4 3 6 8
5 5 2 8 9

#loop through each column and print mean of column
for (i in colnames(df)){
    print( mean (df[[i]]))
}

[1] 3.2
[1] 5.4
[1] 5.2
[1] 4.2

Método 2: use sapply()

O código a seguir mostra como iterar pelos nomes das colunas de um quadro de dados usando sapply() e exibir o valor médio de cada coluna:

 #create data frame
df <- data.frame(var1=c(1, 3, 3, 4, 5),
                 var2=c(7, 7, 8, 3, 2),
                 var3=c(3, 3, 6, 6, 8),
                 var4=c(1, 1, 2, 8, 9))

#view data frame
df

  var1 var2 var3 var4
1 1 7 3 1
2 3 7 3 1
3 3 8 6 2
4 4 3 6 8
5 5 2 8 9

#loop through each column and print mean of column
sapply(df, mean )

var1 var2 var3 var4 
 3.2 5.4 5.2 4.2

Observe que ambos os métodos retornam resultados idênticos.

Relacionado: Um guia para apply(), lapply(), sapply() e tapply() em R

Add a Comment

O seu endereço de email não será publicado. Campos obrigatórios marcados com *