大数の法則
この記事では、大数の法則とは何か、それが確率や統計で何に使われるのかについて説明します。また、大数の法則の適用例や、この法則と中心極限定理との関係についても説明します。
大数の法則とは何ですか?
確率論における大数の法則は、多数回実行した結果を記述する法則です。具体的には、大数の法則は、多数の試行から得られる結果の平均は期待値に近づくというものです。
さらに、大数の法則によれば、実験をすればするほど、結果は期待値に近づきます。
たとえば、コインを 5 回投げた場合、表は 1 回 (20%) しか得られません。ただし、コインを複数回 (1000 回以上) 投げた場合、これは期待値であるため、結果のほぼ半分 (50%) が表になります。これは大数の法則の一例です。
大数の法則の起源は 16 世紀にジェロラモ カルダーノによって発見されましたが、ベルヌーイ、ポアソン、チェビシェフ、マルコフ、ボレル、カンテリ、コルモゴロフ、ヒンチンなど、歴史を通じて多くの著者がこの統計法則の発展に参加してきました。
大数の法則の例
大数の法則の定義を見た後、その意味をより深く理解するために具体的な例を見ていきます。この場合、サイコロを振って得られる結果の確率を分析します。
サイコロを振るときに考えられる結果は 6 つ (1、2、3、4、5、6) あるため、各要素イベントの理論上の確率は次のようになります。
そこで、打ち上げを数回シミュレーションし、結果を頻度表に記録して、大数の法則が守られているかどうかを確認します。
実行される実験の数の重要性がわかるように、最初に 10 回の打ち上げ、次に 100 回、最後に 1,000 回の打ち上げをシミュレーションします。したがって、10 個のランダムなサイコロ投げのシミュレーションから得られた結果は次のとおりです。
ご覧のとおり、わずか 10 回の投球をシミュレートして得られた周波数確率は、理論上の確率と似ていません。
しかし、実験の数が増えるにつれて、これら 2 つの指標はより似てきます。100 回の打ち上げのシミュレーションを見てください。
サイコロの各数字に対して計算された頻度確率は理論上の確率により近づきましたが、それでもかなり異なる値が得られます。
最後に、同じ手順を実行しますが、1000 回の起動をシミュレートします。
最後の表からわかるように、周波数確率の値は理論上の確率に非常に近くなりました。
要約すると、実行する実験の数を増やせば増やすほど、イベントの頻度確率の値は理論的な発生確率に近づきます。したがって、反復を実行すればするほど実験値が理論値に近づくため、大数の法則が尊重されます。
大数の法則の限界
大数の法則はほとんどの場合に有効ですが、特定の種類の確率分布ではこの統計定理が満たされません。
たとえば、コーシー分布やパレート分布 (α<1) は、試行回数が増えるにつれて収束しません。これは、分布の裾が大きいためであり、期待値がないことを意味します。
一方で、一部の実験はその特性により偏りがあるため、研究者は合理的、心理的、経済的などのために結果を(意図的か否かにかかわらず)修正する傾向があります。理由。このような場合、大数の法則は偏りを解決するのに役立ちませんが、試行回数を増やしても偏りは持続します。
大数の法則と中心極限定理
大数の法則と中心極限定理は、確率と統計の 2 つの密接に関連した基本的な規則です。したがって、このセクションでは、それらの関係とは何なのか、そしてそれらの違いは何なのかを見ていきます。
中心極限定理は、中心極限定理とも呼ばれ、母集団の確率分布に関係なく、サンプルサイズが増加するにつれてサンプル平均の分布が正規分布に近づくことを示しています。
大数の法則と中心極限定理の違いは、大数の法則では、多数の試行の平均は期待値に近いということですが、中心極限定理では、多数の試行の平均は期待値に近いということです。サンプルは正規分布に近似します。