Jak iterować po nazwach kolumn w r (z przykładami)


Często możesz chcieć iterować po nazwach kolumn ramki danych w R i wykonywać określone operacje na każdej kolumnie. Można to zrobić na dwa typowe sposoby:

Metoda 1: Użyj pętli For

 for (i in colnames(df)){
   some operation
}

Metoda 2: Użyj sapply()

 sapply(df, some operation )

W tym samouczku przedstawiono przykład wykorzystania każdej z tych metod w praktyce.

Metoda 1: Użyj pętli For

Poniższy kod pokazuje, jak przeglądać nazwy kolumn ramki danych za pomocą pętli for i wyświetlać średnią wartość każdej kolumny:

 #create data frame
df <- data.frame(var1=c(1, 3, 3, 4, 5),
                 var2=c(7, 7, 8, 3, 2),
                 var3=c(3, 3, 6, 6, 8),
                 var4=c(1, 1, 2, 8, 9))

#view data frame
df

  var1 var2 var3 var4
1 1 7 3 1
2 3 7 3 1
3 3 8 6 2
4 4 3 6 8
5 5 2 8 9

#loop through each column and print mean of column
for (i in colnames(df)){
    print( mean (df[[i]]))
}

[1] 3.2
[1] 5.4
[1] 5.2
[1] 4.2

Metoda 2: Użyj sapply()

Poniższy kod pokazuje, jak iterować po nazwach kolumn ramki danych za pomocą sapply() i wyświetlać średnią wartość każdej kolumny:

 #create data frame
df <- data.frame(var1=c(1, 3, 3, 4, 5),
                 var2=c(7, 7, 8, 3, 2),
                 var3=c(3, 3, 6, 6, 8),
                 var4=c(1, 1, 2, 8, 9))

#view data frame
df

  var1 var2 var3 var4
1 1 7 3 1
2 3 7 3 1
3 3 8 6 2
4 4 3 6 8
5 5 2 8 9

#loop through each column and print mean of column
sapply(df, mean )

var1 var2 var3 var4 
 3.2 5.4 5.2 4.2

Należy pamiętać, że obie metody zwracają identyczne wyniki.

Powiązane: Przewodnik po Apply(), lapply(), sapply() i tapply() w R

Dodaj komentarz

Twój adres e-mail nie zostanie opublikowany. Wymagane pola są oznaczone *