연속 확률 분포

이 기사에서는 연속 확률 분포가 무엇인지, 통계에서 어떤 용도로 사용되는지 설명합니다. 따라서 확률 분포가 연속적이라는 것이 무엇을 의미하는지, 연속 분포의 예와 다양한 유형의 연속 분포가 무엇인지 알게 될 것입니다.

연속 확률 분포란 무엇입니까?

연속 확률 분포는 분포 함수 가 연속적인 분포입니다. 따라서 연속 확률 분포는 연속 확률 변수 의 확률을 정의합니다.

예를 들어, 정규 분포와 스튜던트 t 분포는 연속 확률 분포입니다.

연속 확률 분포의 특징 중 하나는 구간 내에서 어떤 값이든 취할 수 있다는 것입니다. 따라서 이산형 확률 분포와 달리 연속형 확률 분포는 소수 값을 사용할 수 있습니다.

연속 분포에서 누적 확률을 계산하려면 분포 곡선 아래의 면적을 찾아야 하므로 이러한 유형의 확률 분포에서 누적 확률 함수는 밀도 함수 의 적분과 동일합니다.

\displaystyle P[X\leq x]=\int_{-\infty}^x f(x)dx

연속 확률 분포의 예

연속 확률 분포의 정의를 살펴본 후에는 개념을 더 잘 이해하기 위해 이러한 유형의 분포에 대한 몇 가지 예를 살펴보겠습니다.

연속 확률 분포의 예:

  1. 코스 내 학생의 비중.
  2. 전기 부품의 수명.
  3. 증권 거래소에 상장된 회사의 주식 수익성.
  4. 자동차의 속도.
  5. 특정 주식의 가격.

연속 확률 분포의 유형

연속 확률 분포의 주요 유형은 다음과 같습니다.

  • 균일하고 연속적인 분포
  • 정규 분포
  • 대수정규분포
  • 카이제곱 분포
  • 스튜던트 t 분포
  • 스네데코 F 유통
  • 지수분포
  • 베타 배포
  • 감마 분포
  • 와이블 분포
  • 파레토 분포

각 유형의 연속 확률 분포는 아래에 자세히 설명되어 있습니다.

균일하고 연속적인 분포

연속 균등 분포 (Continuous 균등 분포)는 직사각형 분포 라고도 하며 모든 값이 동일한 확률로 나타나는 연속 확률 분포의 한 유형입니다. 즉, 연속 균일 분포는 확률이 구간에 걸쳐 균일하게 분포되는 분포입니다.

연속 균일 분포는 일정한 확률을 갖는 연속 변수를 설명하는 데 사용됩니다. 마찬가지로, 연속 균일 분포는 무작위 프로세스를 정의하는 데 사용됩니다. 왜냐하면 모든 결과가 동일한 확률을 갖는다면 결과에 무작위성이 있음을 의미하기 때문입니다.

연속 균일 분포에는 등확률 구간을 정의하는 두 가지 특성 매개변수 ab가 있습니다. 따라서 연속균등분포의 기호는 U(a,b) 이며, 여기서 ab 는 분포의 특성값이다.

X\sim U(a,b)

예를 들어, 무작위 실험의 결과가 5에서 9 사이의 값을 가질 수 있고 가능한 모든 결과가 동일한 발생 확률을 갖는 경우 실험은 연속 균일 분포 U(5.9)로 시뮬레이션될 수 있습니다.

정규 분포

정규 분포는 그래프가 종 모양이고 평균에 대해 대칭인 연속 확률 분포입니다. 통계에서 정규 분포는 매우 다른 특성을 가진 현상을 모델링하는 데 사용되므로 이 분포가 매우 중요합니다.

실제로 통계에서 정규 분포는 모든 확률 분포 중에서 단연 가장 중요한 분포로 간주됩니다. 정규 분포는 수많은 실제 현상을 모델링할 수 있을 뿐만 아니라 다른 유형의 확률 분포를 근사하는 데에도 사용할 수 있기 때문입니다. 배포판. 특정 조건에서.

정규분포의 기호는 대문자 N입니다. 따라서 변수가 정규분포를 따른다는 것을 나타내기 위해 N으로 표시하고 그 산술평균과 표준편차의 값을 괄호 안에 추가합니다.

X\sim N(\mu,\sigma)

정규 분포에는 가우스 분포 , 가우스 분포 , 라플라스-가우스 분포 등 다양한 이름이 있습니다.

대수정규분포

로그 정규 분포 또는 로그 정규 분포는 로그가 정규 분포를 따르는 확률 변수를 정의하는 확률 분포입니다.

따라서 변수 X가 정규 분포를 갖는 경우 지수 함수 e x는 로그 정규 분포를 갖습니다.

X\sim \text{Lognormal}(\mu,\sigma^2)

로그 정규분포는 변수 값이 양수인 경우에만 사용할 수 있다는 점에 유의하세요. 로그는 양수 인수를 하나만 받아들이는 함수이기 때문입니다.

통계에서 로그 정규 분포를 다양하게 적용하는 것 중에서 금융 투자를 분석하고 신뢰도 분석을 수행하기 위해 이 분포를 사용하는 것을 구별합니다.

로그 정규 분포는 Tinaut 분포 라고도 하며 때로는 로그 정규 분포 또는 로그 정규 분포 라고도 작성됩니다.

카이제곱 분포

카이제곱 분포는 기호가 χ²인 확률 분포입니다. 보다 정확하게는 카이제곱 분포는 k개의 독립 확률 변수의 제곱을 정규 분포와 합한 것입니다.

따라서 카이제곱 분포는 k 개의 자유도를 갖습니다. 따라서 카이제곱 분포는 그것이 나타내는 정규 분포 변수의 제곱의 합만큼 많은 자유도를 갖습니다.

\displaystyle X\sim\chi^2_k \ \color{orange}\bm{\longrightarrow}\color{black}\ \begin{array}{l}\text{Distribuci\'on chi-cuadrado}\\[2ex]\text{con k grados de libertad}\end{array}

카이제곱 분포는 피어슨 분포 라고도 합니다.

카이제곱 분포는 가설 검정 및 신뢰 구간과 같은 통계적 추론에 널리 사용됩니다. 이러한 유형의 확률 분포가 어떻게 적용되는지 아래에서 살펴보겠습니다.

스튜던트 t 분포

스튜던트 t 분포는 통계학에서 널리 사용되는 확률 분포입니다. 특히 스튜던트 t 분포는 스튜던트 t 검정에서 두 표본 평균 간의 차이를 확인하고 신뢰 구간을 설정하는 데 사용됩니다.

스튜던트 t 분포는 1908년 통계학자인 William Sealy Gosset이 “Student”라는 가명으로 개발했습니다.

스튜던트 t 분포는 총 관측치 수에서 1단위를 빼서 얻은 자유도 수로 정의됩니다. 따라서 스튜던트 t 분포의 자유도를 결정하는 공식은 ν=n-1 입니다.

\begin{array}{c}\nu=n-1\\[2ex]X\sim t_\nu\end{array}

스네데코 F 유통

피셔-스네데코 F 분포 또는 간단히 F 분포 라고도 하는 스네데코 F 분포는 통계적 추론, 특히 분산 분석에 사용되는 연속 확률 분포입니다.

Snedecor F 분포의 속성 중 하나는 자유도를 나타내는 두 개의 실수 매개변수 mn 값으로 정의된다는 것입니다. 따라서 Snedecor 분포 F의 기호는 F m,n 입니다. 여기서 mn 은 분포를 정의하는 매개변수입니다.

F_{m,n}\qquad m,n>0″ title=”Rendered by QuickLaTeX.com” height=”18″ width=”139″ style=”vertical-align: -6px;”></p>
</p>
<p> 수학적으로 Snedecor F 분포는 하나의 카이-제곱 분포와 해당 자유도 사이의 몫을 다른 카이-제곱 분포와 해당 자유도 사이의 몫으로 나눈 값과 같습니다. 따라서 Snedecor F 분포를 정의하는 공식은 다음과 같습니다.</p>
</p>
<p class=\left.\begin{array}{c} X\sim \chi_m^2\\[2ex] Y\sim \chi_n^2\end{array}\right\}\color{orange}\bm{\longrightarrow}\color{black}\ F_{m,n}= \cfrac{X/m}{Y/n}

Fisher-Snedecor F 분포는 영국 통계학자 Ronald Fisher와 미국 통계학자 George Snedecor의 이름을 따서 명명되었습니다.

통계에서 Fisher-Snedecor F 분포는 다양한 용도로 사용됩니다. 예를 들어, Fisher-Snedecor F 분포는 다양한 선형 회귀 모델을 비교하는 데 사용되며 이 확률 분포는 분산 분석(ANOVA)에 사용됩니다.

지수분포

지수 분포는 무작위 현상이 발생할 때까지의 대기 시간을 모델링하는 데 사용되는 연속 확률 분포입니다.

보다 정확하게는 지수 분포를 사용하면 포아송 분포를 따르는 두 현상 사이의 대기 시간을 설명할 수 있습니다. 따라서 지수 분포는 포아송 분포와 밀접한 관련이 있습니다.

지수 분포는 그리스 문자 λ로 표시되는 특성 매개변수를 가지며, 연구된 사건이 주어진 기간 동안 발생할 것으로 예상되는 횟수를 나타냅니다.

X\sim \text{Exp}(\lambda)

마찬가지로, 지수 분포는 고장이 발생할 때까지의 시간을 모델링하는 데에도 사용됩니다. 따라서 지수 분포는 신뢰성 및 생존 이론에서 여러 가지 응용 프로그램을 갖습니다.

베타 배포

베타 분포는 구간 (0,1)에서 정의되고 두 개의 양수 매개변수인 α와 β로 매개변수화되는 확률 분포입니다. 즉, 베타 분포의 값은 매개변수 α와 β에 따라 달라집니다.

따라서 베타 분포는 값이 0과 1 사이인 연속 확률 변수를 정의하는 데 사용됩니다.

연속 확률 변수가 베타 분포의 영향을 받는다는 것을 나타내는 몇 가지 표기법이 있으며, 가장 일반적인 표기법은 다음과 같습니다.

\begin{array}{c}X\sim B(\alpha,\beta)\\[2ex]X\sim Beta(\alpha,\beta)\\[2ex]X\sim \beta_{\alpha,\beta}\end{array}

통계에서 베타 배포판은 매우 다양한 용도로 사용됩니다. 예를 들어, 베타 분포는 다양한 표본의 백분율 변화를 연구하는 데 사용됩니다. 마찬가지로 프로젝트 관리에서는 베타 배포를 사용하여 Pert 분석을 수행합니다.

감마 분포

감마 분포는 두 가지 특성 매개변수 α와 λ로 정의되는 연속 확률 분포입니다. 즉, 감마 분포는 두 매개변수의 값에 따라 달라집니다. α는 모양 매개변수이고 λ는 척도 매개변수입니다.

감마 분포의 기호는 그리스 대문자 Γ입니다. 따라서 확률 변수가 감마 분포를 따르는 경우 다음과 같이 작성됩니다.

X\sim \Gamma(\alpha,\lambda)

감마 분포는 형상 매개변수 k = α 및 역 스케일 매개변수 θ = 1/λ를 사용하여 매개변수화할 수도 있습니다. 모든 경우에 감마 분포를 정의하는 두 매개변수는 양의 실수입니다.

일반적으로 감마 분포는 오른쪽으로 치우친 데이터 세트를 모델링하는 데 사용되므로 그래프 왼쪽에 데이터가 더 많이 집중됩니다. 예를 들어, 감마 분포는 전기 부품의 신뢰성을 모델링하는 데 사용됩니다.

와이블 분포

Weibull 분포는 형상 매개변수 α와 척도 매개변수 λ라는 두 가지 특성 매개변수로 정의되는 연속 확률 분포입니다.

통계에서는 생존분석을 위해 주로 Weibull 분포를 사용합니다. 마찬가지로 Weibull 분포는 다양한 분야에 많이 적용됩니다.

X\sim\text{Weibull}(\alpha,\lambda)

저자에 따르면 Weibull 분포는 세 가지 매개변수를 사용하여 매개변수화할 수도 있습니다. 그런 다음 분포 그래프가 시작되는 가로좌표를 나타내는 임계값이라는 세 번째 매개변수가 추가됩니다.

Weibull 분포는 1951년에 이를 자세히 설명한 스웨덴 Waloddi Weibull의 이름을 따서 명명되었습니다. 그러나 Weibull 분포는 1927년 Maurice Fréchet에 의해 발견되었고 1933년 Rosin과 Rammler에 의해 처음 적용되었습니다.

파레토 분포

파레토 분포는 통계에서 파레토 원리를 모형화하는 데 사용되는 연속 확률 분포입니다. 따라서 파레토 분포는 나머지 값보다 발생 확률이 훨씬 높은 몇 가지 값을 갖는 확률 분포입니다.

80-20 법칙이라고도 불리는 파레토의 법칙은 현상의 대부분 원인이 소수의 인구에 기인한다는 통계적 원리라는 것을 기억하세요.

파레토 분포에는 척도 매개변수 x m 과 모양 매개변수 α라는 두 가지 특성 매개변수가 있습니다.

X\sim \text{Pareto}(\alpha,x_m)

원래 파레토 분포는 인구 내 부의 분포를 설명하는 데 사용되었습니다. 그 이유는 부의 대부분이 인구의 작은 부분에 기인하기 때문입니다. 그러나 현재 파레토 분포는 품질 관리, 경제, 과학, 사회 분야 등 다양한 분야에 적용됩니다.

연속적이고 이산적인 확률 분포

확률분포는 연속분포와 이산분포로 분류할 수 있다. 그럼 마지막으로 이 두 가지 유형의 확률 분포의 차이점이 무엇인지 살펴보겠습니다.

연속 확률 분포와 이산 확률 분포의 차이는 취할 수 있는 값의 개수입니다. 연속 분포는 한 간격에 무한한 수의 값을 사용할 수 있는 반면, 이산 분포는 한 간격에 셀 수 있는 수의 값만 사용할 수 있습니다.

따라서 일반적으로 연속 분포와 이산 분포를 구별하는 한 가지 방법은 사용할 수 있는 숫자의 유형에 따라 결정됩니다. 일반적으로 연속형 분포는 소수를 포함한 모든 값을 사용할 수 있는 반면, 이산형 분포는 정수만 사용할 수 있습니다.

의견을 추가하다

이메일 주소는 공개되지 않습니다. 필수 필드는 *로 표시됩니다