كيفية حساب الانحراف المعياري للأعمدة في r
يمكنك استخدام بناء الجملة الأساسي التالي لحساب الانحراف المعياري للأعمدة في R:
#calculate standard deviation of one column sd(df$col1) #calculate standard deviation of all columns sapply(df, sd) #calculate standard deviation of specific columns sapply(df[c(' col1 ', ' col2 ', ' col5 ')], sd)
توضح الأمثلة التالية كيفية استخدام بناء الجملة هذا عمليًا مع إطار البيانات التالي:
#create data frame df <- data. frame (team=c('A', 'B', 'C', 'D', 'E'), points=c(99, 91, 86, 88, 95), assists=c(33, 28, 31, 39, 34), rebounds=c(30, 28, 24, 24, 28)) #view data frame df team points assists rebounds 1 A 99 33 30 2 B 91 28 28 3 C 86 31 24 4 D 88 39 24 5 E 95 34 28
مثال 1: الانحراف المعياري للعمود
يوضح التعليمة البرمجية التالية كيفية حساب الانحراف المعياري لعمود في إطار البيانات:
#calculate standard deviation of 'points' column
sd(df$points)
[1] 5.263079
الانحراف المعياري للقيم في عمود “النقاط” هو 5.263079 .
مثال 2: الانحراف المعياري لجميع الأعمدة
يوضح الكود التالي كيفية حساب الانحراف المعياري لكل عمود في إطار البيانات:
#calculate standard deviation of all columns in data frame
sapply(df, sd)
team points assists rebounds
NA 5.263079 4.062019 2.683282
Warning message:
In var(if (is.vector(x) || is.factor(x)) x else as.double(x), na.rm = na.rm):
NAs introduced by coercion
نظرًا لأن عمود “الفريق” عبارة عن متغير حرف، فإن R يُرجع NA ويعطينا تحذيرًا.
ومع ذلك، فقد نجح في حساب الانحراف المعياري للأعمدة الرقمية الثلاثة الأخرى.
مثال 3: الانحراف المعياري لأعمدة محددة
يوضح التعليمة البرمجية التالية كيفية حساب الانحراف المعياري لأعمدة معينة في إطار البيانات:
#calculate standard deviation of 'points' and 'rebounds' columns
sapply(df[c(' points ', ' rebounds ')], sd)
rebound points
5.263079 2.683282
لاحظ أنه يمكننا أيضًا استخدام قيم فهرس الأعمدة لتحديد الأعمدة:
#calculate standard deviation of 'points' and 'rebounds' columns
sapply(df[c(2, 4)], sd)
rebound points
5.263079 2.683282
مصادر إضافية
تشرح البرامج التعليمية التالية كيفية تنفيذ وظائف شائعة أخرى في R:
كيفية حساب الانحراف المعياري للصفوف في R
كيفية حساب متوسط أعمدة متعددة في R
كيفية العثور على القيمة القصوى عبر أعمدة متعددة في R
كيفية تحديد أعمدة محددة في R