Excel の covariance.p と covariance.s: 違いは何ですか?


統計学における共分散は、ある変数の変化が別の変数の変化とどのように関連しているかを測定する方法です。

正の共分散値は、1 つの変数の増加が別の変数の増加に関連していることを示します。

負の値は、1 つの変数の増加が別の変数の減少に関連していることを示します。

Excel で共分散を計算するために使用できる関数は 2 つあります。

1. COVARIANCE.P:この関数は母集団の共分散を計算します。値の範囲が母集団全体を表す場合にこの関数を使用します。

この関数は次の式を使用します。

母集団共分散 = Σ(x ix )(y iy ) / n

金:

  • Σ: 「和」を意味するギリシャ語の記号
  • x i :変数 x の i番目の
  • x : 変数 x の平均値
  • y i :変数 y のi 番目の
  • y : 変数 y の平均値
  • n:観測値の総数

2. COVARIANCE.S:この関数はサンプルの共分散を計算します。この関数は、値の範囲が母集団全体ではなく値のサンプルを表す場合に使用します。

この関数は次の式を使用します。

標本の共分散 = Σ(x ix )(y iy ) / (n-1)

金:

  • Σ: 「和」を意味するギリシャ語の記号
  • x i :変数 x の i番目の
  • x : 変数 x の平均値
  • y i :変数 y のi 番目の
  • y : 変数 y の平均値
  • n:観測値の総数

2 つの式の微妙な違いに注目してください。COVARIANCE.P はnで除算され、 COVARIANCE.S はn-1で除算されます。

このため、 COVARIANCE.S式は小さい値で除算するため、常に大きい値を生成します。

次の例は、実際に各式を使用する方法を示しています。

例: Excel での COVARIANCE.P と COVARIANCE.S

15 人の異なるバスケットボール選手の得点とアシストを示す次のデータ セットが Excel にあるとします。

次のスクリーンショットは、2 つの異なる共分散式を使用してポイントとアシスト間の共分散を計算する方法を示しています。

標本の共分散は15.69 、母集団の共分散は14.64であることがわかります。

前述したように、標本の共分散は常に母集団の共分散よりも大きくなります。

COVARIANCE.P または COVARIANCE.S を使用する場合

ほとんどの場合、母集団全体のデータを収集することはできません。したがって、私たちは母集団の サンプルについてのみデータを収集します。

したがって、データ セットは一般にサンプルを表すため、データ セットの共分散を計算するにはほとんどの場合COVARIANCE.Sを使用します。

まれに、データが母集団全体を表す場合、代わりにCOVARIANCE.P関数を使用できます。

追加リソース

次のチュートリアルでは、他の一般的に使用される Excel 関数の違いについて説明します。

Excel における STDEV.P と STDEV.S: 違いは何ですか?
Excel の PERCENTILE.EXC と PERCENTILE.INC: 違いは何ですか?
Excel の QUARTILE.EXC と QUARTILE.INC: 違いは何ですか?

コメントを追加する

メールアドレスが公開されることはありません。 が付いている欄は必須項目です