ノンパラメトリック統計
この記事では、ノンパラメトリック統計とは何か、またその用途について説明します。また、ノンパラメトリック統計の応用例や、ノンパラメトリック統計とパラメトリック統計の違いも確認できます。
ノンパラメトリック統計とは何ですか?
ノンパラメトリック統計は、確率分布に適合しない変数、または分布のパラメーターが定義されていない変数を研究する推論統計の分野です。つまり、理論モデルでは定義できない変数にはノンパラメトリック統計が使用されます。
したがって、ノンパラメトリック統計で使用される分布は事前に定義することはできず、むしろ観察されたデータによって決定されます。
パラメトリック統計では通常、特定の仮定を行う必要があるため、ノンパラメトリック統計手法は、特定のテストの前の仮定が満たされない場合に使用されます。以下では、ノンパラメトリック統計とパラメトリック統計の違いを見ていきます。
したがって、ノンパラメトリック統計は、1 つから 5 つ星を獲得した映画レビューなど、評価のある母集団を研究するために使用されます。ノンパラメトリック統計のもう 1 つの用途は、好みを評価する場合など、データにランキングはあるが明確な数値解釈がない場合です。
ノンパラメトリック統計の例
ノンパラメトリック統計の定義を理解したら、その概念を完全に理解するためにその応用例を見ていきます。
99 個の観測値から構成される統計サンプルがあり、次の観測値 (観測番号 100) の値の確率を決定したいとします。
パラメトリック統計を使用する場合は、まずサンプルのいくつかの統計パラメータを計算して、サンプルの特性を知ることになります。次に、計算されたパラメーターを使用してさまざまな統計検定を実行し、次の観測値の確率を決定できます。
ただし、ノンパラメトリック統計のおかげで、サンプルの統計パラメータを計算しなくても、次の値に関する情報を知ることができます。
たとえば、99 個の観測値のサンプルがある場合、ノンパラメトリック統計を使用すると、観測値番号 100 がそれまでのすべての観測値よりも大きい確率が 1% あると判断できます。このようにして、サンプルの最大値のノンパラメトリック推定を実行できます。
つまり、ノンパラメトリック統計を使用すると、サンプルの統計パラメータを知らなくても、確率を計算して推定を行うことができます。
ノンパラメトリック統計検定
ノンパラメトリック検定は、ノンパラメトリック統計に基づく統計手法です。したがって、ノンパラメトリック検定では、確率分布についての仮定を行わずに変数が評価されます。
最もよく知られているノンパラメトリック テストは次のとおりです。
- カイ二乗検定
- 二項検定
- ウィルコクソンの署名付きランクテスト
- 中央値検定
- アンダーソン・ダーリンテスト
- コクランテスト
- コーエンのカッパテスト
- フィッシャーテスト
- フリードマンテスト
- ケンダルテスト
- コルモゴロフ・スミルノフ検定
- カイパーテスト
- マン・ホイットニー検定またはウィルコクソン検定
- マクネマーテスト
- シーゲル・テューキー検定
- サインテスト
- ヴァルド・ウォルフォウィッツ検定
ノンパラメトリック統計の長所と短所
パラメトリック統計と比較して、ノンパラメトリック統計の長所と短所は次のとおりです。
アドバンテージ:
- ノンパラメトリック統計は、数値データと非数値データに適用できます。
- 一般に、ノンパラメトリック検定は必ずしも事前の仮定を満たす必要がないため、より多くの状況で使用できます。
- サンプルサイズが小さい場合、一般にノンパラメトリック検定の適用がより早くなります。
短所:
- データが定性的な情報に変換される際に、情報が失われることがあります。
- サンプルサイズが大きい場合、ノンパラメトリック検定の実行は非常に手間がかかります。
- 一般に、ノンパラメトリック検定の検出力は低くなります。つまり、同じレベルの信頼度で結論を引き出すには、より大きなサンプル サイズが必要になります。
ノンパラメトリック統計とパラメトリック統計
最後に、要約として、ノンパラメトリック統計とパラメトリック統計の違いを見てみましょう。
パラメトリック統計は、データが確率分布によってモデル化できることを前提とする推論統計の分野です。たとえば、Student の t 検定は、Student の t 確率分布を使用するため、パラメトリック検定です。
ノンパラメトリック統計とパラメトリック統計の違いは、理論モデルに基づいているかどうかです。ノンパラメトリック統計では確率分布に適合しない変数が調査されますが、パラメトリック統計では定義された確率分布が使用されます。