R'de birden fazla sütunun ortalaması nasıl hesaplanır
Çoğunlukla R’deki birden çok sütunun ortalamasını hesaplamak isteyebilirsiniz. Neyse ki bunu colMeans() işlevini kullanarak kolayca yapabilirsiniz.
colMeans(df)
Aşağıdaki örnekler bu fonksiyonun pratikte nasıl kullanılacağını göstermektedir.
Birden fazla sütunun ortalamasını bulmak için colMeans() işlevini kullanma
Aşağıdaki kod, bir veri çerçevesindeki her sütunun ortalamasını bulmak için colMeans() işlevinin nasıl kullanılacağını gösterir:
#create data frame df <- data.frame(var1=c(1, 3, 3, 4, 5), var2=c(7, 7, 8, 3, 2), var3=c(3, 3, 6, 6, 8), var4=c(1, 1, 2, 8, 9)) #find mean of each column colMeans(df) var1 var2 var3 var4 3.2 5.4 5.2 4.2
Ortalamanın hangi sütunlarda bulunacağını da belirtebiliriz:
#find the mean of columns 2 and 3 colMeans(df[, c(2, 3)]) var2 var3 5.4 5.2 #find the mean of the first three columns colMeans(df[, 1:3]) var1 var2 var3 3.2 5.4 5.2
Sayısal olmayan sütunlar varsa, yalnızca sayısal sütunların ortalamasını bulmak istediğinizi belirtmek için sapply() işlevini kullanabilirsiniz:
#create data frame df <- data.frame(var1=c(1, 3, 3, 4, 5), var2=c(7, 7, 8, 3, 2), var3=c(3, 3, 6, 6, 8), var4=c(1, 1, 2, 8, 9), var5=c('a', 'a', 'b', 'b', 'c')) #find mean of only numeric columns colMeans(df[ sapply (df, is.numeric)]) var1 var2 var3 var4 3.2 5.4 5.2 4.2
Herhangi bir sütunda eksik değerler varsa ortalamaları hesaplarken eksik değerleri yok saymak için na.rm=TRUE bağımsız değişkenini kullanabilirsiniz:
#create data frame with some missing values df <- data.frame(var1=c(1, 3, NA, NA, 5), var2=c(7, 7, 8, 3, 2), var3=c(3, 3, 6, 6, 8), var4=c(1, 1, 2, 8, NA)) #find mean of each column and ignore missing values colMeans(df, na.rm= TRUE ) var1 var2 var3 var4 3.0 5.4 5.2 3.0
Ek kaynaklar
R’de sütun adları üzerinde yineleme nasıl yapılır
R’de belirli sütunlar nasıl toplanır