포아송 분포 또는 정규 분포: 차이점은 무엇입니까?


포아송 분포정규 분포는 통계에서 가장 일반적으로 사용되는 확률 분포 중 두 가지입니다.

이 튜토리얼에서는 각 배포판에 대한 빠른 설명과 배포판 간의 두 가지 주요 차이점을 제공합니다.

개요: 포아송 분포

포아송 분포는 주어진 시간 간격 동안 k개의 성공을 얻을 확률을 설명합니다.

확률 변수 X가 포아송 분포를 따르는 경우 X = k 성공 확률은 다음 공식으로 찾을 수 있습니다.

P(X=k) = λ k * e – λ / k!

금:

  • λ: 특정 간격 동안 발생하는 평균 성공 횟수
  • k: 성공 횟수
  • e: 대략 2.71828과 같은 상수

예를 들어, 특정 병원에서 시간당 평균 2건의 출산이 발생한다고 가정해 보겠습니다. 위의 공식을 사용하여 주어진 시간에 3번의 출산을 경험할 확률을 결정할 수 있습니다.

P(X=3) = 2 3 * e – 2 / 3! = 0.1805

주어진 시간에 3번의 출산을 경험할 확률은 0.1805 입니다.

개요: 정규 분포

정규 분포는 임의 변수가 주어진 구간에서 값을 취할 확률을 나타냅니다.

정규 분포의 확률 밀도 함수는 다음과 같이 쓸 수 있습니다.

P(X=x) = (1/σ√ )e -1/2((x-μ)/σ) 2

금:

  • σ: 분포의 표준편차
  • μ: 분포의 평균
  • x: 확률변수의 값

예를 들어, 특정 수달 종의 무게가 μ = 40파운드, σ = 5파운드로 정규 분포를 따른다고 가정합니다.

이 개체군에서 수달을 무작위로 선택하면 다음 공식을 사용하여 무게가 38파운드에서 42파운드 사이일 확률을 찾을 수 있습니다.

P ( 38 < /5) 2 = 0.3108

무작위로 선택한 수달의 무게가 38파운드에서 42파운드 사이일 확률은 0.3108 입니다.

차이점 #1: 신중함 vs. 연속 데이터

포아송 분포와 정규 분포의 첫 번째 차이점은 각 확률 분포로 모델링되는 데이터 유형입니다.

포아송 분포는 0보다 크거나 같은 정수 값만 사용할 수 있는 이산형 데이터 로 작업할 때 사용됩니다. 여기 몇 가지 예가 있어요.

  • 콜센터에서 시간당 접수된 전화 수
  • 식당의 하루 손님 수
  • 월간 교통사고 건수

각 시나리오에서 확률 변수는 0, 1, 2, 3 등의 값만 사용할 수 있습니다.

정규 분포는 음의 무한대에서 양의 무한대까지 임의의 값을 취할 수 있는 연속 데이터 로 작업할 때 사용됩니다. 여기 몇 가지 예가 있어요.

  • 특정 동물의 무게
  • 특정 식물의 높이
  • 여자 마라톤 기록
  • 섭씨 온도

이러한 시나리오에서 무작위 변수는 -11.3, 21.343435, 85 등과 같은 을 가질 수 있습니다.

차이점 #2: 분포 형태

포아송 분포와 정규 분포의 두 번째 차이점은 분포 모양에 있습니다.

정규 분포는 항상 종 모양을 갖습니다.

그러나 포아송 분포의 모양은 분포의 평균값에 따라 달라집니다.

예를 들어, μ = 3 과 같이 평균 값이 작은 포아송 분포는 오른쪽으로 크게 치우쳐 있습니다.

그러나 μ = 20 과 같이 더 큰 평균값을 갖는 포아송 분포는 정규 분포와 마찬가지로 종 모양을 나타냅니다.

포아송 분포는 0보다 크거나 같은 정수 값에만 사용할 수 있으므로 포아송 분포의 하한은 평균 값에 관계없이 항상 0입니다.

추가 리소스

다음 자습서에서는 포아송 분포에 대한 추가 정보를 제공합니다.

포아송 분포 소개
포아송 분포의 네 가지 가설
포아송 분포의 5가지 구체적인 예

다음 자습서에서는 정규 분포에 대한 추가 정보를 제공합니다.

정규분포 소개
정규분포의 6가지 구체적인 예
정규 분포 데이터 세트 생성기

의견을 추가하다

이메일 주소는 공개되지 않습니다. 필수 필드는 *로 표시됩니다