R で複数の列を集計する方法 (例あり)


R でAggregate()関数を使用すると、データ フレーム内の 1 つ以上の変数の概要統計を生成できます。

この関数は次の基本構文を使用します。

集計 (sum_var ~ group_var、データ = df、FUN = 平均)

金:

  • sum_var:要約する変数
  • group_var:グループ化する変数
  • data:データブロックの名前
  • FUN:計算する要約統計量

このチュートリアルでは、この関数を使用して R で一度に 1 つ以上の列を集計する例をいくつか示します。例として次のデータ フレームを使用します。

 #create data frame
df <- data. frame (team=c('A', 'A', 'A', 'B', 'B', 'B', 'C', 'C'),
                 conf=c('E', 'E', 'W', 'W', 'W', 'W', 'W', 'W'),
                 points=c(1, 3, 3, 4, 5, 7, 7, 9),
                 rebounds=c(7, 7, 8, 3, 2, 7, 14, 13))

#view data frame
df

  team conf points rebounds
1 AE 1 7
2 AE 3 7
3 AW 3 8
4 BW 4 3
5 BW 5 2
6 BW 7 7
7 CW 7 14
8 CW 9 13

例 1: 変数の要約と変数によるグループ化

次のコードは、チームごとにグループ化された平均得点を見つける方法を示しています。

 #find mean points scored, grouped by team
aggregate(points ~ team, data = df, FUN = mean, na. rm = TRUE )

  team points
1 A 2.333333
2 B 5.333333
3 C 8.000000

例 2: 変数の要約と複数の変数によるグループ化

次のコードは、チームおよびカンファレンスごとにグループ化された平均得点を見つける方法を示しています。

 #find mean points scored, grouped by team and conference
aggregate(points ~ team + conf, data = df, FUN = mean, na. rm = TRUE )

  team conf points
1 AE 2.000000
2 AW 3.000000
3 BW 5.333333
4 CW 8.000000

例 3: 複数の変数の要約と 1 つの変数によるグループ化

次のコードは、チームごとにグループ化された得点平均とリバウンド平均を見つける方法を示しています。

 #find mean points scored, grouped by team and conference
aggregate( cbind (points,rebounds) ~ team, data = df, FUN = mean, na. rm = TRUE )

  team points rebounds
1 A 2.333333 7.333333
2 B 5.333333 4.000000
3 C 8.000000 13.500000

例 4: 複数の変数の要約と複数の変数によるグループ化

次のコードは、チームおよびカンファレンスごとにグループ化された得点平均とリバウンド平均を見つける方法を示しています。

 #find mean points scored, grouped by team and conference
aggregate( cbind (points,rebounds) ~ team + conf, data = df, FUN = mean, na. rm = TRUE )

  team conf points rebounds
1 AE 2.000000 7.0
2AW 3.000000 8.0
3 BW 5.333333 4.0
4 CW 8.000000 13.5

追加リソース

R で複数の列の平均を計算する方法
R で特定の列を合計する方法
R の特定の行を合計する方法

コメントを追加する

メールアドレスが公開されることはありません。 が付いている欄は必須項目です