ポアソン分布と正規分布: 違いは何ですか?
ポアソン分布と正規分布は、統計学で最もよく使用される確率分布の 2 つです。
このチュートリアルでは、各ディストリビューションの簡単な説明と、ディストリビューション間の 2 つの重要な違いについて説明します。
概要: ポアソン分布
ポアソン分布は、指定された時間間隔中にk回の成功が得られる確率を表します。
確率変数X がポアソン分布に従う場合、 X = kが成功する確率は次の式で求められます。
P(X=k) = λ k * e – λ / k!
金:
- λ:特定の間隔中に発生した成功の平均数
- k:成功回数
- e:約 2.71828 に等しい定数
たとえば、特定の病院で 1 時間あたり平均 2 件の出産があったとします。上記の式を使用して、特定の 1 時間に 3 回の出産が起こる確率を求めることができます。
P(X=3) = 2 3 * e – 2 / 3! = 0.1805
1 時間に 3 回の出産が起こる確率は0.1805です。
概要: 正規分布
正規分布は、ランダム変数が指定された間隔で値を取る確率を表します。
正規分布の確率密度関数は次のように記述できます。
P(X=x) = (1/σ√ 2π )e -1/2((x-μ)/σ) 2
金:
- σ:分布の標準偏差
- μ:分布の平均
- x:確率変数の値
たとえば、特定の種のカワウソの体重が μ = 40 ポンドおよび σ = 5 ポンドで正規分布すると仮定します。
この母集団からカワウソをランダムに選択すると、次の式を使用して、そのカワウソの体重が 38 ポンドから 42 ポンドの間である確率を求めることができます。
P ( 38 < /5) 2 = 0.3108
ランダムに選択されたカワウソの体重が 38 ~ 42 ポンドである確率は0.3108です。
違い #1: 控えめなものと連続データ
ポアソン分布と正規分布の最初の違いは、各確率分布によってモデル化されるデータのタイプです。
ポアソン分布は、ゼロ以上の整数値のみを取ることができる離散データを操作する場合に使用されます。ここではいくつかの例を示します。
- コールセンターで 1 時間あたりに受信した通話数
- レストランの 1 日あたりの客数
- 月ごとの自動車事故件数
各シナリオでは、確率変数は値 0、1、2、3 などのみを取ることができます。
正規分布は、負の無限大から正の無限大までの任意の値を取ることができる連続データを操作する場合に使用されます。ここではいくつかの例を示します。
- ある動物の体重
- ある植物の高さ
- 女子マラソンのタイム
- 摂氏温度
これらのシナリオでは、確率変数は -11.3、21.343435、85 などの任意の値を取ることができます。
違い #2: 分布の形状
ポアソン分布と正規分布の 2 番目の違いは、分布の形状にあります。
正規分布は常に釣鐘型になります。
ただし、ポアソン分布の形状は分布の平均値に応じて異なります。
たとえば、 μ = 3のような平均値が小さいポアソン分布は、右に強く偏ります。
ただし、 μ = 20のようなより大きな平均値を持つポアソン分布は、正規分布とまったく同じように釣鐘型を示します。
ポアソン分布はゼロ以上の整数値でのみ使用できるため、平均値に関係なく、ポアソン分布の下限は常にゼロになることに注意してください。
追加リソース
次のチュートリアルでは、ポアソン分布に関する追加情報を提供します。
ポアソン分布の概要
ポアソン分布の 4 つの仮説
ポアソン分布の 5 つの具体例
次のチュートリアルでは、正規分布に関する追加情報を提供します。