平均値の違いに関する仮説検定

によるベンジャミン・アンダーソン博士 8月 3, 2023 統計 0コメント

この記事では、統計における平均値の仮説検定とはどのような違いがあるのか、また何に使用されるのかについて説明します。同様に、平均値の違いに関する仮説検定と、段階的に解決する演習を行う方法もわかります。

平均差の仮説検定とは何ですか?

平均値の差に関する仮説検定は、 2 つの母集団の平均値が異なるという仮説を棄却または受け入れるために使用される統計検定です。つまり、平均値仮説検定の差を使用して、2 つの母集団の平均値が同じか異なるかを判断します。

仮説検定で行われる決定は、以前に確立された信頼レベルに基づいて行われるため、仮説検定の結果が常に正しいことを保証することはできません。むしろ、それが真である可能性が最も高い結果であるということを念頭に置いてください。

2 つの平均の差の仮説検定には、検定統計量を計算し、それを臨界値と比較して帰無仮説を棄却するかどうかが含まれます。以下では、平均の差に対する仮説検定を実行する方法を見ていきます。

最後に、統計学では、仮説検定は仮説対比、仮説検定、または有意性検定と呼ばれることもあることを覚えておいてください。

➤参照:平均の差の標本分布

平均値の差の仮説検定式

平均の差に関する仮説を検定するために使用する公式は、母集団の分散が既知であるかどうか、また、既知でない場合はそれらが同じであると仮定できるか、または異なると仮定できるかによって異なります。したがって、このセクションでは、ケースに応じてどの公式を使用するかを見ていきます。

既知のバリエーション

分散が既知の場合に、平均の差の仮説検定統計量を計算する式は次のとおりです。

$\displaystyle Z=\frac{\displaystyle (\overline{x_1}-\overline{x_2})-(\mu_1-\mu_2)}{\displaystyle\sqrt{\frac{\sigma_1^2}{n_1}+\frac{\sigma_2^2}{n_2}}}$

金：

$Z$

は、標準正規分布に従う、分散が既知の 2 つの平均の差の仮説検定統計量です。
$\mu_1$

は母集団 1 の平均です。
$\mu_2$

は母集団 2 の平均です。
$\overline{x_1}$

はサンプル 1 の平均です。
$\overline{x_2}$

はサンプル 2 の平均です。
$\sigma_1$

は母集団 1 の標準偏差です。
$\sigma_2$

は母集団 2 の標準偏差です。
$n_1$

サンプルサイズは1です。
$n_2$

サンプルサイズは2です。

これは最も一般的なケースではないため、この式は一部の特定のケースでのみ使用されることに注意してください。

未知の等しい偏差

母集団の分散が不明であるが等しいと仮定される場合、平均の差の仮説検定統計量を計算する式は次のとおりです。

$\displaystyle t=\frac{\displaystyle (\overline{x_1}-\overline{x_2})-(\mu_1-\mu_2)}{\displaystyle s_p\sqrt{\frac{1}{n_1}+\frac{1}{n_2}}}$

金：

$t$

は、未知の分散を伴う平均の差の仮説検定統計量であり、自由度 n ₁ + n ₂ -2 のスチューデントの t 分布に従います。
$\mu_1$

は母集団 1 の平均です。
$\mu_2$

は母集団 2 の平均です。
$\overline{x_1}$

はサンプル 1 の平均です。
$\overline{x_2}$

はサンプル 2 の平均です。
$s_p$

は結合された標準偏差です。
$n_1$

サンプルサイズは1です。
$n_2$

サンプルサイズは2です。

2 つのサンプルの標準偏差を組み合わせた値は、次の式で計算されます。

$\displaystyle s_p=\sqrt{\frac{(n_1-1)s_1^2+(n_2-1)s_2^2}{n_1+n_2-2}}$

未知のさまざまなバリエーション

母集団の分散が不明で、さらに異なると仮定される場合、平均の差に対する仮説検定統計量を計算する式は次のとおりです。

$\displaystyle t=\frac{\displaystyle (\overline{x_1}-\overline{x_2})-(\mu_1-\mu_2)}{\displaystyle \sqrt{\frac{s_1^2}{n_1}+\frac{s_2^2}{n_2}}}$

金：

$t$

は、未知の分散を伴う平均の差の仮説検定統計量であり、スチューデントの t 分布に従います。
$\mu_1$

は母集団 1 の平均です。
$\mu_2$

は母集団 2 の平均です。
$\overline{x_1}$

はサンプル 1 の平均です。
$\overline{x_2}$

はサンプル 2 の平均です。
$\sigma_1$

は母集団 1 の標準偏差です。
$\sigma_2$

は母集団 2 の標準偏差です。
$n_1$

サンプルサイズは1です。
$n_2$

サンプルサイズは2です。

ただし、この場合、スチューデントの t 分布の自由度は次の式を使用して計算されます。

$\displaystyle GL=\frac{\displaystyle\left(\frac{s_1^2}{n_1}+\frac{s_2^2}{n_2}\right)^2}{\displaystyle\frac{\displaystyle\frac{s_1^2}{n_1}}{n_1-1}+\frac{\displaystyle\frac{s_2^2}{n_2}}{n_2-1}}$

➤参照:平均の差の信頼区間の式

平均値の違いに対する仮説検定の具体例

平均の差に関する仮説検定の概念を理解するために、このタイプの仮説検定の具体的な例を見ていきます。

競合する 2 つの企業の給与に関する統計調査を行いたいと考えています。具体的には、2 つの企業の平均給与が異なるかどうかを判断したいと考えています。これを行うために、ある会社から 47 人の労働者のサンプルを採取し、もう 1 つの会社から 55 人の労働者のサンプルを採取します。最初のサンプルからは平均給与 40,000 ドルと標準偏差 12,000 ドルが得られ、2 番目のサンプルからは平均給与 46,000 ドルと標準偏差 18,000 ドルが得られます。 5% の有意水準で仮説検定を実行して、平均給与が異なるかどうかを判断します。

この場合、2 つの平均の差に対する仮説検定の帰無仮説と対立仮説は次のとおりです。

$\begin{cases}H_0: \mu_1-\mu_2=0\\[2ex] H_1:\mu_1-\mu_2\neq 0 \end{cases}$

この場合、人口格差は不明ですが、両社は競合企業であり、事業を展開する市場の労働条件が非常に似ているため、人口格差は等しいと想定できます。したがって、使用すべき平均の差の仮説検定統計量の式は次のとおりです。

$\displaystyle t=\frac{\displaystyle (\overline{x_1}-\overline{x_2})-(\mu_1-\mu_2)}{\displaystyle s_p\sqrt{\frac{1}{n_1}+\frac{1}{n_2}}}$

したがって、2 つのサンプルのプールされた標準偏差を計算します。

$\begin{aligned}\displaystyle s_p&=\sqrt{\frac{(n_1-1)s_1^2+(n_2-1)s_2^2}{n_1+n_2-2}}\\[2ex]\displaystyle s_p&=\sqrt{\frac{(47-1)\cdot 12000^2+(55-1)\cdot 18000^2}{47+55-2}}\\[2ex]s_p&=15530,61\end{aligned}$

ここで、平均の差に仮説検定公式を適用します。

$\displaystyle t=\frac{\displaystyle (\overline{x_1}-\overline{x_2})-(\mu_1-\mu_2)}{\displaystyle s_p\sqrt{\frac{1}{n_1}+\frac{1}{n_2}}}=\cfrac{(40000-46000)-0}{\displaystyle 15530,61\sqrt{\frac{1}{47}+\frac{1}{55}}}=-1,94$