比率の差の信頼区間

によるベンジャミン・アンダーソン博士 7月 28, 2023 ガイド 0コメント

比率の差の信頼区間 (CI) は、一定の信頼度で 2 つの母集団比率間の真の差が含まれる可能性が高い値の範囲です。

このチュートリアルでは次について説明します。

研究者は多くの場合、2 つの母集団の比率の差を推定したいと考えます。この差を推定するために、各母集団から無作為にサンプルを収集し、各サンプルの割合を計算します。次に、2 つの比率の差を比較できます。

ただし、サンプルの比率間の差異が母集団の比率間の真の差異に対応するかどうかを確実に知ることはできません。これが、2 つの比率の差の信頼区間を作成できる理由です。これにより、人口比率間の真の差異が含まれる可能性のある値の範囲が得られます。

たとえば、A 郡の特定の法律を支持する住民の割合と B 郡の法律を支持する住民の割合の差を推定したいとします。

各郡には何千人もの住民がいるため、各郡の住民全員を訪問して調査するには時間と費用がかかりすぎます。

代わりに、各郡から単純に無作為に住民のサンプルを採取し、各サンプルにおける法律を支持する割合を使用して、2 つの郡間の割合の本当の違いを推定することができます。

サンプルはランダムであるため、2 つのサンプル間の比率の差が 2 つの母集団間の比率の差に正確に対応するという保証はありません。したがって、この不確実性を捉えるために、2 つの母集団間の比率の真の違いが含まれる可能性が高い値の範囲を含む信頼区間を作成できます。

次の式を使用して、2 つの母集団比率の差の信頼区間を計算します。

信頼区間 = (p ₁ –p ₂ ) +/- z*√(p ₁ (1-p ₁ )/n ₁ + p ₂ (1-p ₂ )/n ₂ )

金：

使用する Z 値は、選択した信頼レベルによって異なります。次の表は、最も一般的な信頼水準の選択肢に対応する Z 値を示しています。

より高い信頼水準はより大きな Z 値に対応し、より広い信頼区間につながることに注意してください。これは、たとえば、同じデータセットでは 95% 信頼区間が 90% 信頼区間よりも広いことを意味します。

A 郡の特定の法律を支持する住民の割合と B 郡の法律を支持する住民の割合との差を推定したいとします。各サンプルの概要データは次のとおりです。

サンプル 1:

サンプル 2:

母集団の比率の違いに対するさまざまな信頼区間を見つける方法は次のとおりです。

90% 信頼区間:

(.62-.46) +/- 1.645*√(.62(1-.62)/100 + .46(1-.46)/100) = [.0456, .2744]

95% 信頼区間:

(.62-.46) +/- 1.96*√(.62(1-.62)/100 + .46(1-.46)/100) = [.0236, .2964]

99% 信頼区間:

(0.62-0.46) +/- 2.58*√(0.62(1-0.62)/100 + 0.46(1-0.46)/100) = [-0.0192, 0.3392]

注:これらの信頼区間は、「比率の差の信頼区間計算ツール」を使用して見つけることもできます。

信頼区間を解釈する方法は次のとおりです。

95% の確率で、信頼区間 [.0236, .2964] に、2 つの郡間の法律を支持する住民の割合の真の差異が含まれています。

この間隔には値「0」が含まれていないため、A 郡と B 郡では、この法律を支持する住民の割合に実際の違いがある可能性が非常に高いことを意味します。

私はベンジャミンです。退職した統計教授から、専任の Statorials 教育者になりました。統計分野における豊富な経験と専門知識を活かして、私は Statorials を通じて学生に力を与えるために自分の知識を共有することに尽力しています。もっと知る