Jak iterować po nazwach kolumn w r (z przykładami)
Często możesz chcieć iterować po nazwach kolumn ramki danych w R i wykonywać określone operacje na każdej kolumnie. Można to zrobić na dwa typowe sposoby:
Metoda 1: Użyj pętli For
for (i in colnames(df)){ some operation }
Metoda 2: Użyj sapply()
sapply(df, some operation )
W tym samouczku przedstawiono przykład wykorzystania każdej z tych metod w praktyce.
Metoda 1: Użyj pętli For
Poniższy kod pokazuje, jak przeglądać nazwy kolumn ramki danych za pomocą pętli for i wyświetlać średnią wartość każdej kolumny:
#create data frame df <- data.frame(var1=c(1, 3, 3, 4, 5), var2=c(7, 7, 8, 3, 2), var3=c(3, 3, 6, 6, 8), var4=c(1, 1, 2, 8, 9)) #view data frame df var1 var2 var3 var4 1 1 7 3 1 2 3 7 3 1 3 3 8 6 2 4 4 3 6 8 5 5 2 8 9 #loop through each column and print mean of column for (i in colnames(df)){ print( mean (df[[i]])) } [1] 3.2 [1] 5.4 [1] 5.2 [1] 4.2
Metoda 2: Użyj sapply()
Poniższy kod pokazuje, jak iterować po nazwach kolumn ramki danych za pomocą sapply() i wyświetlać średnią wartość każdej kolumny:
#create data frame df <- data.frame(var1=c(1, 3, 3, 4, 5), var2=c(7, 7, 8, 3, 2), var3=c(3, 3, 6, 6, 8), var4=c(1, 1, 2, 8, 9)) #view data frame df var1 var2 var3 var4 1 1 7 3 1 2 3 7 3 1 3 3 8 6 2 4 4 3 6 8 5 5 2 8 9 #loop through each column and print mean of column sapply(df, mean ) var1 var2 var3 var4 3.2 5.4 5.2 4.2
Należy pamiętać, że obie metody zwracają identyczne wyniki.
Powiązane: Przewodnik po Apply(), lapply(), sapply() i tapply() w R