連続確率分布

この記事では、連続確率分布とは何か、また統計で何に使用されるのかについて説明します。したがって、確率分布が連続的であることの意味、連続分布の例、およびさまざまな種類の連続分布とは何かを理解することができます。

連続確率分布とは何ですか?

連続確率分布とは、分布関数が連続である確率分布です。したがって、連続確率分布は、連続確率変数の確率を定義します。

たとえば、正規分布とスチューデントの t 分布は連続確率分布です。

連続確率分布の特性の 1 つは、区間内で任意の値を取ることができることです。したがって、離散確率分布とは異なり、連続確率分布は 10 進数値を取ることができます。

連続分布では、累積確率を計算するには、分布の曲線の下の面積を見つける必要があるため、このタイプの確率分布では、累積確率関数は密度関数の積分に相当します。

\displaystyle P[X\leq x]=\int_{-\infty}^x f(x)dx

連続確率分布の例

連続確率分布の定義を理解したら、概念をよりよく理解するためにこのタイプの分布の例をいくつか見ていきます。

連続確率分布の例:

  1. コース内の生徒の体重。
  2. 電気部品の寿命。
  3. 証券取引所に上場されている企業の株式の収益性。
  4. 車の速度。
  5. 特定の株の価格。

連続確率分布の種類

連続確率分布の主なタイプは次のとおりです。

  • 均一かつ連続的な分布
  • 正規分布
  • 対数正規分布
  • カイ二乗分布
  • 学生の t 分布
  • スネデコール F ディストリビューション
  • 指数分布
  • ベータ版の配布
  • ガンマ分布
  • ワイブル分布
  • パレート分布

それぞれのタイプの連続確率分布については、以下で詳しく説明します。

均一かつ連続的な分布

連続一様分布は長方形分布とも呼ばれ、すべての値が同じ出現確率を持つ連続確率分布の一種です。換言すれば、連続一様分布とは、確率が区間にわたって一様に分布する分布である。

連続一様分布は、確率が一定である連続変数を記述するために使用されます。同様に、すべての結果が同じ確率を持つ場合、結果にランダム性があることを意味するため、連続一様分布はランダム プロセスを定義するために使用されます。

連続一様分布には、等確率区間を定義する 2 つの特性パラメーターabがあります。したがって、連続一様分布の記号はU(a,b)です。ここで、 abは分布の特性値です。

X\sim U(a,b)

たとえば、ランダムな実験の結果が 5 から 9 までの任意の値をとり、考えられるすべての結果が同じ確率で発生する場合、実験は連続一様分布 U(5.9) でシミュレートできます。

正規分布

正規分布は連続確率分布であり、そのグラフは釣鐘型で平均に対して対称です。統計学では、正規分布は非常に異なる特性を持つ現象をモデル化するために使用されます。そのため、この分布は非常に重要です。

実際、統計学では、正規分布はすべての確率分布の中で最も重要な分布であると考えられています。正規分布は、現実世界の多数の現象をモデル化できるだけでなく、他のタイプの現象を近似するためにも使用できるためです。配布物。特定の条件下で。

正規分布の記号は大文字の N です。したがって、変数が正規分布に従うことを示すために、変数は文字 N で示され、その算術平均と標準偏差の値が括弧内に追加されます。

X\sim N(\mu,\sigma)

正規分布には、ガウス分布ガウス分布ラプラス ガウス分布など、さまざまな名前があります。

対数正規分布

対数正規分布、または対数正規分布 は、対数が正規分布に従う確率変数を定義する確率分布です。

したがって、変数 X が正規分布を持つ場合、指数関数 e x は対数正規分布になります。

X\sim \text{Lognormal}(\mu,\sigma^2)

対数は正の引数を 1 つだけ受け入れる関数であるため、対数正規分布は変数の値が正の場合にのみ使用できることに注意してください。

統計における対数正規分布のさまざまな用途の中で、この分布を金融投資の分析と信頼性分析の実行に使用することを区別します。

対数正規分布は、ティノー分布としても知られ、対数正規分布または対数正規分布とも呼ばれます。

カイ二乗分布

カイ二乗分布は、記号が χ² である確率分布です。より正確には、カイ二乗分布は、正規分布を持つk 個の独立確率変数の二乗の合計です。

したがって、カイ二乗分布にはk 個の自由度があります。したがって、カイ二乗分布は、それが表す正規分布変数の二乗和と同じくらいの自由度を持ちます。

\displaystyle X\sim\chi^2_k \ \color{orange}\bm{\longrightarrow}\color{black}\ \begin{array}{l}\text{Distribuci\'on chi-cuadrado}\\[2ex]\text{con k grados de libertad}\end{array}

カイ二乗分布は、ピアソン分布としても知られています。

カイ二乗分布は、仮説検定や信頼区間などの統計的推論で広く使用されています。このタイプの確率分布がどのように応用されるかを以下で見ていきます。

学生の t 分布

スチューデントの t 分布は、統計で広く使用されている確率分布です。具体的には、スチューデントの t 分布はスチューデントの t 検定で使用され、2 つのサンプルの平均間の差を決定し、信頼区間を確立します。

スチューデントの t 分布は、統計学者ウィリアム シーリー ゴセットによって 1908 年に「スチューデント」という仮名で開発されました。

スチューデントの t 分布は、観測値の総数から 1 単位を減算することで得られる自由度の数によって定義されます。したがって、スチューデントの t 分布の自由度を決定する式はν=n-1です。

\begin{array}{c}\nu=n-1\\[2ex]X\sim t_\nu\end{array}

スネデコール F ディストリビューション

スネデコール F 分布 はフィッシャー・スネデコール F 分布または単にF 分布とも呼ばれ、統計的推論、特に分散分析で使用される連続確率分布です。

Snedecor F 分布の特性の 1 つは、自由度を示す 2 つの実数パラメーターmnの値によって定義されることです。したがって、Snedecor 分布 F のシンボルはF m,nです。ここで、 mnは分布を定義するパラメーターです。

F_{m,n}\qquad m,n>0″ title=”Rendered by QuickLaTeX.com” height=”18″ width=”139″ style=”vertical-align: -6px;”></p>
</p>
<p>数学的には、Snedecor F 分布は、1 つのカイ二乗分布とその自由度の間の商を、別のカイ二乗分布とその自由度の間の商で割ったものに等しくなります。したがって、Snedecor F 分布を定義する式は次のとおりです。</p>
</p>
<p class=\left.\begin{array}{c} X\sim \chi_m^2\\[2ex] Y\sim \chi_n^2\end{array}\right\}\color{orange}\bm{\longrightarrow}\color{black}\ F_{m,n}= \cfrac{X/m}{Y/n}

フィッシャー・スネデコール F 分布の名前は、イギリスの統計学者ロナルド フィッシャーとアメリカの統計学者ジョージ スネデコールに由来しています。

統計では、Fisher-Snedecor F 分布はさまざまな用途に使用できます。たとえば、Fisher-Snedecor F 分布はさまざまな線形回帰モデルを比較するために使用され、この確率分布は分散分析 (ANOVA) で使用されます。

指数分布

指数分布は、ランダム現象の発生の待ち時間をモデル化するために使用される連続確率分布です。

より正確には、指数分布により、ポアソン分布に従う 2 つの現象の間の待ち時間を記述することが可能になります。したがって、指数分布はポアソン分布と密接に関係しています。

指数分布には、ギリシャ文字 λ で表される特徴的なパラメーターがあり、特定の期間内に調査対象のイベントが発生すると予想される回数を示します。

X\sim \text{Exp}(\lambda)

同様に、指数分布は障害が発生するまでの時間をモデル化するためにも使用されます。したがって、指数分布は信頼性と生存理論においていくつかの用途があります。

ベータ版の配布

ベータ分布は、区間 (0,1) で定義され、2 つの正のパラメーター α と β によってパラメーター化された確率分布です。つまり、ベータ分布の値はパラメータαとβに依存します。

したがって、ベータ分布は、値が 0 から 1 までの連続確率変数を定義するために使用されます。

連続確率変数がベータ分布によって支配されることを示す表記法がいくつかありますが、最も一般的なものは次のとおりです。

\begin{array}{c}X\sim B(\alpha,\beta)\\[2ex]X\sim Beta(\alpha,\beta)\\[2ex]X\sim \beta_{\alpha,\beta}\end{array}

統計では、ベータ分布は非常に多様な用途に使用されます。たとえば、ベータ分布は、さまざまなサンプルのパーセンテージの変動を調べるために使用されます。同様に、プロジェクト管理では、Pert 分析を実行するためにベータ配布が使用されます。

ガンマ分布

ガンマ分布は、 2 つの特性パラメータ α と λ によって定義される連続確率分布です。言い換えれば、ガンマ分布は 2 つのパラメータの値に依存します。α は形状パラメータ、λ はスケール パラメータです。

ガンマ分布の記号はギリシャ文字の大文字 Γ です。したがって、確率変数がガンマ分布に従う場合、次のように記述されます。

X\sim \Gamma(\alpha,\lambda)

ガンマ分布は、形状パラメーター k = α と逆スケール パラメーター θ = 1/λ を使用してパラメーター化することもできます。すべての場合において、ガンマ分布を定義する 2 つのパラメーターは正の実数です。

通常、ガンマ分布は右に歪んだデータセットをモデル化するために使用されるため、グラフの左側にデータが集中します。たとえば、ガンマ分布は電気コンポーネントの信頼性をモデル化するために使用されます。

ワイブル分布

ワイブル分布は、形状パラメーター α とスケール パラメーター λ の 2 つの特性パラメーターによって定義される連続確率分布です。

統計学では、ワイブル分布は主に生存分析に使用されます。同様に、ワイブル分布にはさまざまな分野で多くの応用例があります。

X\sim\text{Weibull}(\alpha,\lambda)

著者らによると、ワイブル分布は 3 つのパラメータでパラメータ化することもできます。次に、分布グラフが始まる横座標を示す、しきい値と呼ばれる 3 番目のパラメーターが追加されます。

ワイブル分布は、1951 年に詳細に説明したスウェーデン人のワロッディ ワイブルにちなんで命名されました。ただし、ワイブル分布は 1927 年にモーリス フレシェによって発見され、1933 年にロジンとラムラーによって初めて適用されました。

パレート分布

パレート分布は、パレートの法則をモデル化するために統計で使用される連続確率分布です。したがって、パレート分布は、出現確率が残りの値よりもはるかに高いいくつかの値を持つ確率分布です。

パレートの法則は 80-20 の法則とも呼ばれ、現象の原因のほとんどは人口のごく一部によるものであるという統計原則であることを思い出してください。

パレート分布には、スケール パラメーター x mと形状パラメーター α という 2 つの特徴的なパラメーターがあります。

X\sim \text{Pareto}(\alpha,x_m)

元々、パレート分布は人口内の富の分布を表すために使用されていました。なぜなら、その大部分は人口の少数の割合によるものだったからです。しかし現在、パレート分布は、品質管理、経済学、科学、社会分野など、多くの用途に応用されています。

連続および離散確率分布

確率分布は連続分布と離散分布に分類できます。それでは最後に、これら 2 種類の確率分布の違いを見てみましょう。

連続確率分布と離散確率分布の違いは、取り得る値の数です。連続分布は区間内で無限の数の値を取ることができますが、離散分布は区間内で可算数の値しか取ることができません。

したがって、一般に、連続分布と離散分布を区別する 1 つの方法は、それらが取り得る数値の種類によって異なります。通常、連続分布は 10 進数を含む任意の値を取ることができますが、離散分布は整数のみを取ることができます。

コメントを追加する

メールアドレスが公開されることはありません。 が付いている欄は必須項目です