R の列の標準偏差を計算する方法

によるベンジャミン・アンダーソン博士 7月 23, 2023 ガイド 0コメント

次の基本構文を使用して、R の列の標準偏差を計算できます。

 #calculate standard deviation of one column
sd(df$col1)

#calculate standard deviation of all columns
sapply(df, sd)

#calculate standard deviation of specific columns
sapply(df[c(' col1 ', ' col2 ', ' col5 ')], sd)

次の例は、次のデータフレームでこの構文を実際に使用する方法を示しています。

 #create data frame
df <- data. frame (team=c('A', 'B', 'C', 'D', 'E'),
                 points=c(99, 91, 86, 88, 95),
                 assists=c(33, 28, 31, 39, 34),
                 rebounds=c(30, 28, 24, 24, 28))

#view data frame
df

  team points assists rebounds
1 A 99 33 30
2 B 91 28 28
3 C 86 31 24
4 D 88 39 24
5 E 95 34 28

例 1: 列の標準偏差

次のコードは、データフレーム内の列の標準偏差を計算する方法を示しています。

 #calculate standard deviation of 'points' column
sd(df$points)

[1] 5.263079

「ポイント」列の値の標準偏差は5.263079です。

例 2: すべての列の標準偏差

次のコードは、データフレーム内の各列の標準偏差を計算する方法を示しています。

 #calculate standard deviation of all columns in data frame
sapply(df, sd)

    team points assists rebounds 
      NA 5.263079 4.062019 2.683282 
Warning message:
In var(if (is.vector(x) || is.factor(x)) x else as.double(x), na.rm = na.rm):
  NAs introduced by coercion

「チーム」列は文字変数であるため、R は NA を返し、警告を表示します。

ただし、他の 3 つの数値列の標準偏差は正常に計算されます。

例 3: 特定の列の標準偏差

次のコードは、データフレーム内の特定の列の標準偏差を計算する方法を示しています。

 #calculate standard deviation of 'points' and 'rebounds' columns
sapply(df[c(' points ', ' rebounds ')], sd)

  rebound points 
5.263079 2.683282

列のインデックス値を使用して列を選択することもできることに注意してください。

 #calculate standard deviation of 'points' and 'rebounds' columns
sapply(df[c(2, 4)], sd)

  rebound points 
5.263079 2.683282

追加リソース

次のチュートリアルでは、R で他の一般的な関数を実行する方法について説明します。

R の行の標準偏差を計算する方法
 R で複数の列の平均を計算する方法
 R の複数の列にわたる最大値を見つける方法
 R で特定の列を選択する方法

著者について

ベンジャミン・アンダーソン博士

私はベンジャミンです。退職した統計教授から、専任の Statorials 教育者になりました。統計分野における豊富な経験と専門知識を活かして、私は Statorials を通じて学生に力を与えるために自分の知識を共有することに尽力しています。もっと知る