포아송 분포 또는 정규 분포: 차이점은 무엇입니까?

에 의해 벤자민 앤더슨 7월 21, 2023 가이드 댓글 0개

포아송 분포 와 정규 분포는 통계에서 가장 일반적으로 사용되는 확률 분포 중 두 가지입니다.

이 튜토리얼에서는 각 배포판에 대한 빠른 설명과 배포판 간의 두 가지 주요 차이점을 제공합니다.

개요: 포아송 분포

포아송 분포는 주어진 시간 간격 동안 k개의 성공을 얻을 확률을 설명합니다.

확률 변수 X가 포아송 분포를 따르는 경우 X = k 성공 확률은 다음 공식으로 찾을 수 있습니다.

P(X=k) = λ ^k * e ^{– λ} / k!

금:

λ: 특정 간격 동안 발생하는 평균 성공 횟수
k: 성공 횟수
e: 대략 2.71828과 같은 상수

예를 들어, 특정 병원에서 시간당 평균 2건의 출산이 발생한다고 가정해 보겠습니다. 위의 공식을 사용하여 주어진 시간에 3번의 출산을 경험할 확률을 결정할 수 있습니다.

P(X=3) = 2 ³ * e ^{– 2} / 3! = 0.1805

주어진 시간에 3번의 출산을 경험할 확률은 0.1805 입니다.

개요: 정규 분포

정규 분포는 임의 변수가 주어진 구간에서 값을 취할 확률을 나타냅니다.

정규 분포의 확률 밀도 함수는 다음과 같이 쓸 수 있습니다.

P(X=x) = (1/σ√ 2π )e ^{-1/2((x-μ)/σ) ²}

금:

σ: 분포의 표준편차
μ: 분포의 평균
x: 확률변수의 값

예를 들어, 특정 수달 종의 무게가 μ = 40파운드, σ = 5파운드로 정규 분포를 따른다고 가정합니다.

이 개체군에서 수달을 무작위로 선택하면 다음 공식을 사용하여 무게가 38파운드에서 42파운드 사이일 확률을 찾을 수 있습니다.

P ( ^³⁸ ^{< /5) ²} = 0.3108

무작위로 선택한 수달의 무게가 38파운드에서 42파운드 사이일 확률은 0.3108 입니다.

차이점 #1: 신중함 vs. 연속 데이터

포아송 분포와 정규 분포의 첫 번째 차이점은 각 확률 분포로 모델링되는 데이터 유형입니다.

포아송 분포는 0보다 크거나 같은 정수 값만 사용할 수 있는 이산형 데이터 로 작업할 때 사용됩니다. 여기 몇 가지 예가 있어요.

콜센터에서 시간당 접수된 전화 수
식당의 하루 손님 수
월간 교통사고 건수

각 시나리오에서 확률 변수는 0, 1, 2, 3 등의 값만 사용할 수 있습니다.

정규 분포는 음의 무한대에서 양의 무한대까지 임의의 값을 취할 수 있는 연속 데이터 로 작업할 때 사용됩니다. 여기 몇 가지 예가 있어요.

특정 동물의 무게
특정 식물의 높이
여자 마라톤 기록
섭씨 온도

이러한 시나리오에서 무작위 변수는 -11.3, 21.343435, 85 등과 같은 값 을 가질 수 있습니다.

차이점 #2: 분포 형태

포아송 분포와 정규 분포의 두 번째 차이점은 분포 모양에 있습니다.

정규 분포는 항상 종 모양을 갖습니다.

그러나 포아송 분포의 모양은 분포의 평균값에 따라 달라집니다.

예를 들어, μ = 3 과 같이 평균 값이 작은 포아송 분포는 오른쪽으로 크게 치우쳐 있습니다.

그러나 μ = 20 과 같이 더 큰 평균값을 갖는 포아송 분포는 정규 분포와 마찬가지로 종 모양을 나타냅니다.

포아송 분포는 0보다 크거나 같은 정수 값에만 사용할 수 있으므로 포아송 분포의 하한은 평균 값에 관계없이 항상 0입니다.

추가 리소스

다음 자습서에서는 포아송 분포에 대한 추가 정보를 제공합니다.

포아송 분포 소개
포아송 분포의 네 가지 가설
포아송 분포의 5가지 구체적인 예

다음 자습서에서는 정규 분포에 대한 추가 정보를 제공합니다.

정규분포 소개
정규분포의 6가지 구체적인 예
정규 분포 데이터 세트 생성기

저자 소개

벤자민 앤더슨

안녕하세요. 저는 통계학 교수를 퇴직하고 전임 통계 교사로 변신한 벤자민입니다. 통계 분야의 광범위한 경험과 전문 지식을 바탕으로 Statorials를 통해 학생들에게 힘을 실어주기 위해 지식을 공유하고 싶습니다. 더 알아보기