統計 vs.パラメータ: 違いは何ですか?
推論統計の分野には、統計とパラメーターという 2 つの重要な用語があり、その違いを理解しておく必要があります。
この記事では、2 つの用語の違いをよりよく理解できるように、各用語の定義を実際の例といくつかの実践的な問題とともに説明します。
統計とパラメータ: 定義
統計量は、サンプルの特定の特性を説明する数値です。
パラメータは、母集団の特性を説明する数値です。
母集団は測定したいすべての個々の要素を表すのに対し、サンプルは単に母集団の一部を表すことに注意してください。
たとえば、フロリダのヤシの木の平均高さを特定したいとします。州内には何万本ものヤシの木がある可能性があり、すべてを回ってそれぞれの高さを測定することは事実上不可能です。
代わりに、100 本のヤシの木のランダムなサンプルを選択し、そのサンプルのみの木の平均高さを見つけることができます。平均が 36 フィートであると仮定しましょう。
この例では、母集団はフロリダのすべてのヤシの木で構成されています。サンプルは、ランダムに選択した 100 本の木のグループです。
この統計は、サンプル内の木の平均高さ (36 フィート) です。
このパラメータは、フロリダ州内のすべてのヤシの木の真の平均高さですが、フロリダ州内のすべてのヤシの木を測定することは決してできないため、不明です。
パラメータは実際に測定したい値ですが、統計値は取得がはるかに簡単であるため、パラメータの値を推定するために使用する値です。
一般的に使用される統計とパラメータ
前の例では、 母集団の平均値を測定したいと考えましたが、測定したい母集団パラメータは他にもたくさんあります。
次の表は、測定対象となる可能性のある一般的なパラメーターのリストと、対応するサンプル統計を示しています。
パラメータと統計は異なる記号を使用して記述されることに注意してください。
対策 | 統計の例 | 母集団パラメータ |
---|---|---|
平均 | バツ | μ(ミュー) |
標準偏差 | s | σ(シグマ) |
分散 | s2 | σ2 (シグマ二乗) |
割合 | p | π(パイ) |
相関 | r | ρ (ロー) |
回帰係数 | b | β(ベータ) |
どのような問題においても、私たちは常に母集団パラメータを測定したいと考えます。しかし、母集団の個々の要素を実際に測定することは、時間がかかりすぎたり、費用がかかりすぎたり、あるいは単に不可能であることがよくあります。したがって、代わりに標本統計量を計算し、この統計量を使用して真の母集団パラメータを推定するのです。
オタクのメモ:
標本統計が真の母集団パラメータの適切な推定値であることを保証するには、代表的な標本、つまり個人の特徴が母集団全体の特徴とよく一致する標本を確実に取得する必要があります。
さまざまなサンプリング方法を使用して代表的なサンプルを取得する方法については、 この記事で詳しく説明します。
統計とパラメータ: 実際的な問題
次の練習問題は、統計とメトリックの違いをよりよく理解するのに役立ちます。
まず、問題を読みます。次に、各問題の統計とパラメータを特定してみます。正解は各問題の下にリストされるので、自分の作業を確認できます。
問題 #1
研究者は、特定の種類の鳥の平均翼長を知りたいと考えています。彼女は 50 羽の鳥のサンプルを無作為に収集し、各鳥の翼幅を測定したところ、平均の翼幅が 15.6 インチであることがわかりました。
回答:研究者が測定したいパラメータは、その特定の鳥種の個体群全体の平均翼幅です。統計はサンプル平均であり、15.6 インチであることがわかります。
問題 #2
選挙管理委員会は、特定の都市で特定の税法を支持する成人の割合を把握したいと考えています。彼らは成人 1,000 人の無作為サンプルを取得し、34% が法律を支持していることを発見しました。
回答:自治体が測定したいパラメータは、その税法に賛成している市内の全成人の割合です。統計はサンプルの割合であり、34% であることがわかります。
問題 #3
経済学者のチームは、特定の国の成人収入の標準偏差を推定したいと考えています。彼らは成人 10,000 人の無作為サンプルを取得し、彼らの収入の標準偏差が 12,500 ドルであることを発見しました。
回答:経済学者チームが測定したいパラメータは、その国の成人全員の収入の標準偏差です。統計はサンプル標準偏差であり、12,500 ドルであることがわかります。
問題 #4
研究者は、特定の大学の学生の平均コーヒー消費量を推定したいと考えています。彼は 200 人の学生から無作為に抽出したサンプルを取得し、コーヒーの平均消費量が学生 1 人あたり 1 日あたり 2.2 カップであることを発見しました。
回答:研究者が測定したいパラメータは、この大学の全学生の平均コーヒー消費量です。この統計はサンプル平均であり、生徒 1 人あたり 1 日あたり 2.2 カップであることがわかります。