Come scorrere i nomi delle colonne in r (con esempi)


Spesso potresti voler scorrere i nomi delle colonne di un frame di dati in R ed eseguire determinate operazioni su ciascuna colonna. Esistono due modi comuni per eseguire questa operazione:

Metodo 1: utilizzare un ciclo For

 for (i in colnames(df)){
   some operation
}

Metodo 2: utilizzare sapply()

 sapply(df, some operation )

Questo tutorial mostra un esempio di come utilizzare ciascuno di questi metodi nella pratica.

Metodo 1: utilizzare un ciclo For

Il codice seguente mostra come scorrere i nomi delle colonne di un frame di dati utilizzando un ciclo for e visualizzare il valore medio di ciascuna colonna:

 #create data frame
df <- data.frame(var1=c(1, 3, 3, 4, 5),
                 var2=c(7, 7, 8, 3, 2),
                 var3=c(3, 3, 6, 6, 8),
                 var4=c(1, 1, 2, 8, 9))

#view data frame
df

  var1 var2 var3 var4
1 1 7 3 1
2 3 7 3 1
3 3 8 6 2
4 4 3 6 8
5 5 2 8 9

#loop through each column and print mean of column
for (i in colnames(df)){
    print( mean (df[[i]]))
}

[1] 3.2
[1] 5.4
[1] 5.2
[1] 4.2

Metodo 2: utilizzare sapply()

Il codice seguente mostra come scorrere i nomi delle colonne di un frame di dati utilizzando sapply() e visualizzare il valore medio di ciascuna colonna:

 #create data frame
df <- data.frame(var1=c(1, 3, 3, 4, 5),
                 var2=c(7, 7, 8, 3, 2),
                 var3=c(3, 3, 6, 6, 8),
                 var4=c(1, 1, 2, 8, 9))

#view data frame
df

  var1 var2 var3 var4
1 1 7 3 1
2 3 7 3 1
3 3 8 6 2
4 4 3 6 8
5 5 2 8 9

#loop through each column and print mean of column
sapply(df, mean )

var1 var2 var3 var4 
 3.2 5.4 5.2 4.2

Tieni presente che entrambi i metodi restituiscono risultati identici.

Correlati: una guida per apply(), lapply(), sapply() e tapply() in R

Aggiungi un commento

Il tuo indirizzo email non sarà pubblicato. I campi obbligatori sono contrassegnati *