Rでグループごとの相関を計算する方法


次の基本構文を使用して、R のグループごとに 2 つの変数間の相関関係を計算できます。

 library (dplyr)

df %>%
  group_by(group_var) %>%
  summarize(cor=cor(var1, var2))

この特定の構文は、 group_varによってグループ化されたvar1var2の間の 相関関係を計算します。

次の例は、この構文を実際に使用する方法を示しています。

例: R のグループごとの相関を計算する

さまざまなチームのバスケットボール選手に関する情報を含む次のデータ フレームがあるとします。

 #create data frame
df <- data. frame (team=c('A', 'A', 'A', 'A', 'B', 'B', 'B', 'B'),
                 points=c(18, 22, 19, 14, 14, 11, 20, 28),
                 assists=c(2, 7, 9, 3, 12, 10, 14, 21))

#view data frame
df

  team points assists
1 to 18 2
2 to 22 7
3 A 19 9
4 A 14 3
5 B 14 12
6 B 11 10
7 B 20 14
8 B 28 21

dplyrパッケージの次の構文を使用して、チームごとにグループ化されたポイントアシストの間の相関関係を計算できます。

 library (dplyr)

df %>%
  group_by(team) %>%
  summarize(cor=cor(points, assists))

# A tibble: 2 x 2
  team horn
   
1 A 0.603
2 B 0.982

結果から次のことがわかります。

  • チーム A の得点とアシストの相関係数は0.603です。
  • チーム B の得点とアシストの間の相関係数は0.982です。

どちらの相関係数も正であるため、両チームの得点とアシストの関係が正であることがわかります。

関連: 「強い」相関関係とは何ですか?

追加リソース

次のチュートリアルでは、R で他の一般的な操作を実行する方法について説明します。

Rでグループごとに一意の値をカウントする方法
Rでグループごとの合計を計算する方法
R でグループごとの平均を計算する方法
R でグループごとの要約統計量を計算する方法

コメントを追加する

メールアドレスが公開されることはありません。 が付いている欄は必須項目です