통계에서 확률질량함수(pmf)란 무엇입니까?


종종 PMF로 축약되는 확률 질량 함수는 이산 확률 변수가 특정 값을 취할 확률을 알려줍니다.

예를 들어 주사위를 한 번 굴린다고 가정해 보겠습니다. x를 주사위가 놓인 숫자로 지정하면 x 가 다른 값과 같을 확률은 다음과 같이 설명할 수 있습니다.

  • 피(X=1): 1/6
  • 피(X=2): 1/6
  • P(X=3): 1/6
  • P(X=4): 1/6
  • 피(X=5): 1/6
  • P(X=6): 1/6

주사위가 1에서 6 사이의 숫자에 나올 확률은 동일합니다.

다음은 이러한 확률을 확률 질량 함수로 작성하는 방법입니다.

확률 질량 함수 예

다이어그램의 왼쪽에는 오른쪽 결과와 관련된 확률이 표시됩니다.

통계의 확률질량함수

확률 질량 함수의 특징은 모든 확률의 합이 1이 되어야 한다는 것입니다. 이 PMF가 다음 조건을 충족한다는 것을 알 수 있습니다.

확률의 합 = 1/6 + 1/6 + 1/6 + 1/6 + 1/6 + 1/6 = 1.

확률 질량 함수에 대한 지원은 이산 확률 변수가 취할 수 있는 값 집합을 의미합니다. 이 예에서 지지도는 주사위 값이 이러한 값 중 하나를 취할 수 있으므로 {1, 2, 3, 4, 5, 6}입니다.

지원 이외의 경우 PMF 값은 0입니다. 예를 들어, 주사위가 “0”, “7” 또는 “8”에 나올 확률은 괄호 안에 이러한 숫자가 포함되지 않기 때문에 0입니다.

실제로 확률 질량 함수

실제로 확률 질량 함수의 가장 일반적인 두 가지 예는 이항 분포포아송 분포 에 관한 것입니다.

이항 분포

확률 변수 X가 이항 분포를 따르는 경우 X = k 성공 확률은 다음 공식으로 찾을 수 있습니다.

P(X=k) = n C k * p k * (1-p) nk

금:

  • n: 시행 횟수
  • k: 성공 횟수
  • p: 주어진 시행의 성공 확률
  • n C k : n 번 시행에서 k번 성공하는 방법의 수

예를 들어 동전을 3번 던졌다고 가정해 보겠습니다. 위의 공식을 사용하여 3번의 던지기에서 앞면이 0, 1, 2, 3번 나올 확률을 결정할 수 있습니다.

  • P(X=0) = 3 C 0 * 0.5 0 * (1-0.5) 3-0 = 1 * 1 * (0.5) 3 = 0.125
  • P(X=1) = 3 C 1 * 0.5 1 * (1-0.5) 3-1 = 1 * 1 * (0.5) 2 = 0.375
  • P(X=2) = 3 C 2 * 0.5 2 * (1-0.5) 3-2 = 1 * 1 * (0.5) 1 = 0.375
  • P(X=3) = 3 C 3 * 0.5 3 * (1-0.5) 3-3 = 1 * 1 * (0.5) 0 = 0.125

생선 유통

확률 변수 X가 포아송 분포를 따르는 경우 X = k 성공 확률은 다음 공식으로 찾을 수 있습니다.

P(X=k) = λ k * e – λ / k!

금:

  • λ: 특정 간격 동안 발생하는 평균 성공 횟수
  • k: 성공 횟수
  • e: 대략 2.71828과 같은 상수

예를 들어, 특정 병원에서 시간당 평균 2건의 출산이 발생한다고 가정해 보겠습니다. 위의 공식을 사용하여 0, 1, 2, 3번의 출산 등을 경험할 확률을 결정할 수 있습니다. 주어진 시간에:

  • P(X=0) = 2 0 * e – 2 / 0! = 0.1353
  • P(X=1) = 2 1 * e – 2 / 1! = 0.2707
  • P(X=2) = 2 2 * e – 2 / 2! = 0.2707
  • P(X=3) = 2 3 * e – 2 / 3! = 0.1805

PMF 보기

우리는 종종 막대 그래프를 사용하여 확률 질량 함수를 시각화합니다.

예를 들어, 다음 막대 차트는 이전 예에서 설명한 포아송 분포에 대한 시간당 출생 수와 관련된 확률을 보여줍니다.

확률 질량 함수를 시각화하는 방법

출생 수는 무한대로 확장될 수 있지만 10 이후에는 확률이 너무 작아서 막대 그래프에서도 볼 수 없습니다.

PMF의 속성

확률 질량 함수에는 다음과 같은 속성이 있습니다.

1. 지지 확률은 모두 긍정적입니다. 예를 들어, 주사위가 1과 6 사이에 떨어질 확률은 양수이지만 다른 모든 결과의 확률은 0입니다.

2. 모든 결과는 0과 1 사이의 확률을 갖습니다 . 예를 들어 주사위가 1과 6 사이에 떨어질 확률은 각 결과에 대해 1/6 또는 0.1666666입니다.

3. 모든 확률의 합은 1과 같아야 합니다 . 예를 들어 주사위가 특정 숫자에 떨어질 확률의 합은 1/6 + 1/6 + 1/6 + 1/6 + 1/6 + 1입니다. /6 = 1.

추가 리소스

확률변수란 무엇입니까?
CDF 또는 PDF: 차이점은 무엇입니까?
이항분포 소개
포아송 분포 소개

의견을 추가하다

이메일 주소는 공개되지 않습니다. 필수 필드는 *로 표시됩니다