Rでグループごとの相関を計算する方法
次の基本構文を使用して、R のグループごとに 2 つの変数間の相関関係を計算できます。
library (dplyr)
df %>%
group_by(group_var) %>%
summarize(cor=cor(var1, var2))
この特定の構文は、 group_varによってグループ化されたvar1とvar2の間の 相関関係を計算します。
次の例は、この構文を実際に使用する方法を示しています。
例: R のグループごとの相関を計算する
さまざまなチームのバスケットボール選手に関する情報を含む次のデータ フレームがあるとします。
#create data frame
df <- data. frame (team=c('A', 'A', 'A', 'A', 'B', 'B', 'B', 'B'),
points=c(18, 22, 19, 14, 14, 11, 20, 28),
assists=c(2, 7, 9, 3, 12, 10, 14, 21))
#view data frame
df
team points assists
1 to 18 2
2 to 22 7
3 A 19 9
4 A 14 3
5 B 14 12
6 B 11 10
7 B 20 14
8 B 28 21
dplyrパッケージの次の構文を使用して、チームごとにグループ化されたポイントとアシストの間の相関関係を計算できます。
library (dplyr)
df %>%
group_by(team) %>%
summarize(cor=cor(points, assists))
# A tibble: 2 x 2
team horn
1 A 0.603
2 B 0.982
結果から次のことがわかります。
- チーム A の得点とアシストの相関係数は0.603です。
- チーム B の得点とアシストの間の相関係数は0.982です。
どちらの相関係数も正であるため、両チームの得点とアシストの関係が正であることがわかります。
関連: 「強い」相関関係とは何ですか?
追加リソース
次のチュートリアルでは、R で他の一般的な操作を実行する方法について説明します。
Rでグループごとに一意の値をカウントする方法
Rでグループごとの合計を計算する方法
R でグループごとの平均を計算する方法
R でグループごとの要約統計量を計算する方法