포아송 분포 또는 정규 분포: 차이점은 무엇입니까?
포아송 분포 와 정규 분포는 통계에서 가장 일반적으로 사용되는 확률 분포 중 두 가지입니다.
이 튜토리얼에서는 각 배포판에 대한 빠른 설명과 배포판 간의 두 가지 주요 차이점을 제공합니다.
개요: 포아송 분포
포아송 분포는 주어진 시간 간격 동안 k개의 성공을 얻을 확률을 설명합니다.
확률 변수 X가 포아송 분포를 따르는 경우 X = k 성공 확률은 다음 공식으로 찾을 수 있습니다.
P(X=k) = λ k * e – λ / k!
금:
- λ: 특정 간격 동안 발생하는 평균 성공 횟수
- k: 성공 횟수
- e: 대략 2.71828과 같은 상수
예를 들어, 특정 병원에서 시간당 평균 2건의 출산이 발생한다고 가정해 보겠습니다. 위의 공식을 사용하여 주어진 시간에 3번의 출산을 경험할 확률을 결정할 수 있습니다.
P(X=3) = 2 3 * e – 2 / 3! = 0.1805
주어진 시간에 3번의 출산을 경험할 확률은 0.1805 입니다.
개요: 정규 분포
정규 분포는 임의 변수가 주어진 구간에서 값을 취할 확률을 나타냅니다.
정규 분포의 확률 밀도 함수는 다음과 같이 쓸 수 있습니다.
P(X=x) = (1/σ√ 2π )e -1/2((x-μ)/σ) 2
금:
- σ: 분포의 표준편차
- μ: 분포의 평균
- x: 확률변수의 값
예를 들어, 특정 수달 종의 무게가 μ = 40파운드, σ = 5파운드로 정규 분포를 따른다고 가정합니다.
이 개체군에서 수달을 무작위로 선택하면 다음 공식을 사용하여 무게가 38파운드에서 42파운드 사이일 확률을 찾을 수 있습니다.
P ( 38 < /5) 2 = 0.3108
무작위로 선택한 수달의 무게가 38파운드에서 42파운드 사이일 확률은 0.3108 입니다.
차이점 #1: 신중함 vs. 연속 데이터
포아송 분포와 정규 분포의 첫 번째 차이점은 각 확률 분포로 모델링되는 데이터 유형입니다.
포아송 분포는 0보다 크거나 같은 정수 값만 사용할 수 있는 이산형 데이터 로 작업할 때 사용됩니다. 여기 몇 가지 예가 있어요.
- 콜센터에서 시간당 접수된 전화 수
- 식당의 하루 손님 수
- 월간 교통사고 건수
각 시나리오에서 확률 변수는 0, 1, 2, 3 등의 값만 사용할 수 있습니다.
정규 분포는 음의 무한대에서 양의 무한대까지 임의의 값을 취할 수 있는 연속 데이터 로 작업할 때 사용됩니다. 여기 몇 가지 예가 있어요.
- 특정 동물의 무게
- 특정 식물의 높이
- 여자 마라톤 기록
- 섭씨 온도
이러한 시나리오에서 무작위 변수는 -11.3, 21.343435, 85 등과 같은 값 을 가질 수 있습니다.
차이점 #2: 분포 형태
포아송 분포와 정규 분포의 두 번째 차이점은 분포 모양에 있습니다.
정규 분포는 항상 종 모양을 갖습니다.
그러나 포아송 분포의 모양은 분포의 평균값에 따라 달라집니다.
예를 들어, μ = 3 과 같이 평균 값이 작은 포아송 분포는 오른쪽으로 크게 치우쳐 있습니다.
그러나 μ = 20 과 같이 더 큰 평균값을 갖는 포아송 분포는 정규 분포와 마찬가지로 종 모양을 나타냅니다.
포아송 분포는 0보다 크거나 같은 정수 값에만 사용할 수 있으므로 포아송 분포의 하한은 평균 값에 관계없이 항상 0입니다.
추가 리소스
다음 자습서에서는 포아송 분포에 대한 추가 정보를 제공합니다.
포아송 분포 소개
포아송 분포의 네 가지 가설
포아송 분포의 5가지 구체적인 예
다음 자습서에서는 정규 분포에 대한 추가 정보를 제공합니다.
정규분포 소개
정규분포의 6가지 구체적인 예
정규 분포 데이터 세트 생성기