كيفية حساب متوسط أعمدة متعددة في r
غالبًا ما قد ترغب في حساب متوسط الأعمدة المتعددة في R. ولحسن الحظ، يمكنك القيام بذلك بسهولة باستخدام الدالة colMeans() .
colMeans(df)
توضح الأمثلة التالية كيفية استخدام هذه الوظيفة عمليًا.
استخدام colMeans() للعثور على متوسط أعمدة متعددة
يوضح التعليمة البرمجية التالية كيفية استخدام الدالة colMeans() للعثور على متوسط كل عمود في إطار البيانات:
#create data frame df <- data.frame(var1=c(1, 3, 3, 4, 5), var2=c(7, 7, 8, 3, 2), var3=c(3, 3, 6, 6, 8), var4=c(1, 1, 2, 8, 9)) #find mean of each column colMeans(df) var1 var2 var3 var4 3.2 5.4 5.2 4.2
يمكننا أيضًا تحديد الأعمدة التي سيتم العثور على المتوسط لها:
#find the mean of columns 2 and 3 colMeans(df[, c(2, 3)]) var2 var3 5.4 5.2 #find the mean of the first three columns colMeans(df[, 1:3]) var1 var2 var3 3.2 5.4 5.2
إذا كانت هناك أعمدة غير رقمية، فيمكنك استخدام sapply() لتحديد أنك تريد فقط العثور على متوسط الأعمدة الرقمية:
#create data frame df <- data.frame(var1=c(1, 3, 3, 4, 5), var2=c(7, 7, 8, 3, 2), var3=c(3, 3, 6, 6, 8), var4=c(1, 1, 2, 8, 9), var5=c('a', 'a', 'b', 'b', 'c')) #find mean of only numeric columns colMeans(df[ sapply (df, is.numeric)]) var1 var2 var3 var4 3.2 5.4 5.2 4.2
وإذا كانت هناك قيم مفقودة في أي أعمدة، فيمكنك استخدام الوسيطة na.rm=TRUE لتجاهل القيم المفقودة عند حساب المتوسطات:
#create data frame with some missing values df <- data.frame(var1=c(1, 3, NA, NA, 5), var2=c(7, 7, 8, 3, 2), var3=c(3, 3, 6, 6, 8), var4=c(1, 1, 2, 8, NA)) #find mean of each column and ignore missing values colMeans(df, na.rm= TRUE ) var1 var2 var3 var4 3.0 5.4 5.2 3.0
مصادر إضافية
كيفية التكرار على أسماء الأعمدة في R
كيفية جمع أعمدة محددة في R