Stata でカイ二乗適合度テストを実行する方法


カイ二乗適合度検定は、カテゴリ変数が仮説分布に従うかどうかを判断するために使用されます。

このチュートリアルでは、Stata でカイ二乗適合度検定を実行する方法を説明します。

例: Stata のカイ二乗適合度検定

このテストの実行方法を説明するために、1988 年の米国の女性の労働統計に関する情報が含まれるnlsw88というデータセットを使用します。

次の手順に従ってカイ二乗適合度検定を実行し、このデータセット内の人種の真の分布が白人 70%、黒人 20%、その他 10% であるかどうかを判断します。

ステップ 1: 生データをロードして表示します。

まず、次のコマンドを入力してデータをロードします。

nlsw88システム

次のコマンドを入力すると、生データを表示できます。

br

Stata で生データを表示する

各行には、年齢、人種、婚姻状況、教育レベル、その他のさまざまな要素を含む、個人に関する情報が表示されます。

ステップ 2: 調整パッケージをロードします。

適合性テストを実行するには、 csgofパッケージをインストールする必要があります。これを行うには、次のコマンドを入力します。

csgofを見つける

新しいウィンドウが表示されます。 https://stats.idre.ucla.edu/stat/stata/ado/analysis の csgofというリンクをクリックします。

別のウィンドウが表示されます。 「ここをクリックしてインストールしてください」というリンクをクリックします。

パッケージのインストールには数秒しかかかりません。

ステップ 3: フィットテストを実行します。

パッケージがインストールされたら、データの適合度テストを実行して、実際の人種の内訳が白人 70%、黒人 20%、その他 10% であるかどうかを判断できます。

次の構文を使用してテストを実行します。

csgof 関心のある変数、expperc(期待されるパーセントのリスト)

この場合に使用する正確な構文は次のとおりです。

csgof、expperc(70, 20, 10) を実行します。

Stata のカイ 2 乗の適合度

結果を解釈する方法は次のとおりです。

概要ボックス:このボックスには、各レースの予想パーセンテージ、予想頻度、観測頻度が表示されます。例えば:

  • 白人の予想される割合は 70% でした。これは私たちが指定したパーセンテージです。
  • 白人の予想頻度は 1,572.2 でした。これは、データセット内に 2,246 人の個人が存在するという事実を使用して計算されるため、その数の 70% は 1,572.2 になります。
  • 観察された白人個体の頻度は 1,637 人でした。これは、データセット内の白人の実際の数です。

Chisq(2):これは、適合度検定のカイ二乗検定統計量です。 218.13であることが判明しました。

p:これは、カイ二乗検定統計量に関連付けられた p 値です。これは 0 であることがわかります。これは 0.05 未満であるため、真の人種分布は白人 70%、黒人 20%、その他 10% であるという帰無仮説を棄却できません。私たちは、本当の人種分布がこの仮説的な分布とは異なると結論付けるのに十分な証拠を持っています。

コメントを追加する

メールアドレスが公開されることはありません。 が付いている欄は必須項目です