準分散

この記事では、統計における準分散とは何かについて説明します。したがって、準分散の計算方法、解決された演習、および準分散と分散の違いがわかります。さらに、オンライン計算機を使用して、任意のデータセットの準分散を計算できます。

準分散とは何ですか?

統計学における準分散は、サンプルのばらつきを示す分散の尺度です。より正確には、準分散は、偏差の二乗の合計を観測値の総数から 1 を引いた値で割ったものに等しくなります。

準分散の記号は次のとおりです。

\sigma_{n-1}^2

どちらか

s_{n-1}^2

。という記号も使われることもありますが、

\widehat{s}^2

準分散を表現します。

準分散は、偏りを回避しながらサンプルの分散を決定するために使用されます。そのため、準分散は不偏分散と呼ばれることがよくあります。したがって、準分散は母集団分散の優れた推定量となります。実際、標本の分散を計算するときは、分散の公式の代わりに準分散の公式が使用されることがよくあります。以下では、これら 2 つの統計的尺度の違いについて詳しく説明します。

準分散の公式

準分散を計算するには、値とデータセットの平均の差の二乗和を求め、それをデータの総数から 1 を引いた値で割る必要があります。

したがって、準分散を計算する式は次のようになります。

準分散の公式

金:

  • \sigma_{n-1}^2

    は準分散です。

  • x_i

    データ値です

    i

  • n

    はデータの総数です。

  • \overline{X}

    はデータセットの平均です。

👉以下の計算機を使用して、任意のデータセットの準分散を計算できます。

なぜ n ではなく n-1 で除算するのか疑問に思われるかもしれません。さて、それは偏りを排除することであり、この方法で不偏の推定量を取得します。これがまさに、準分散が母集団分散の優れた推定値である理由です。

準分散計算の例

準分散の定義を理解したので、データ系列の準分散がどのように計算されるかを確認できるように、簡単な例を解きます。

  • 多国籍企業の過去 5 年間の経済的成果を私たちは知っています。大部分は利益を得ましたが、ある年には 1,150 万、2 億、-9 億、700 万ユーロという多大な損失を出しました。このデータセットの準分散を計算します。

データセットの準分散を取得するために最初に行う必要があるのは、その算術平均を計算することです。

\overline{X}=\cfrac{11+5+2+(-9)+7}{5}=3,2

データの平均値がわかったら、準分散の公式を適用します。

\sigma_{n-1}^2=\cfrac{\displaystyle\sum_{i=1}^n\left(x_i-\overline{X}\right)^2}{n-1}

そこで、運動指導によって提供されたデータを次の式に代入します。

\sigma_{n-1}^2=\cfrac{\displaystyle (11-3,2)^2+(5-3,2)^2+(2-3,2)^2+(-9-3,2)^2+(7-3,2)^2}{5-1}

最後に、準分散を計算する演算を解くだけで十分です。

\begin{aligned}\sigma_{n-1}^2&=\cfrac{7,8^2+1,8^2+(-1,2)^2+(-12,2)^2+3,8^2}{5}\\[2ex]&=\cfrac{60,84+3,24+1,44+148,84+14,44}{5-1}\\[2ex]&= \cfrac{228,8}{4} \\[2ex]&=57,2 \ \text{millones de euros}^2\end{aligned}

準分散の単位は統計データの単位と同じ単位ですが 2 乗されているため、このデータセットの準分散は 5,720 万2であることに注意してください。

参照:準標準偏差

準分散計算機

次の計算機に統計データ セットを入力して、その準分散を計算します。データはスペースで区切られ、小数点としてピリオドを使用して入力する必要があります。

分散と準分散

最後に、準分散と分散の違いを見ていきます。名前は似ていますが、計算方法も非常に似ているからです。

準分散と分散の差が式の分母になります。準分散を計算するには、n-1 で割る必要がありますが、分散は n で割ることによって計算されます。

したがって、準分散と分散は数学的に関連しています。準分散は分散に n (データ ポイントの総数) を掛けて n-1 で割ったものに等しいからです。

\sigma_{n-1}^2=\cfrac{n}{n-1}\cdot \sigma^2

したがって、同じデータセットの場合、準分散値は常に分散値より大きくなります。

コメントを追加する

メールアドレスが公開されることはありません。 が付いている欄は必須項目です