결합 확률 분포란 무엇입니까?
양방향 빈도표는 두 범주형 변수의 빈도(또는 “개수”)를 표시하는 표입니다.
예를 들어, 다음 양방향 표는 100명에게 야구, 농구, 축구 중 어떤 스포츠를 선호하는지 묻는 설문 조사 결과를 보여줍니다.
행에는 응답자의 성별이 표시되고 열에는 응답자가 선택한 스포츠가 표시됩니다.
이 예에는 스포츠와 성별이라는 두 가지 변수가 있습니다.
결합 확률 분포는 주어진 개인이 변수에 대해 두 가지 특정 값을 취할 확률을 간단히 설명합니다.
“결합”이라는 단어는 우리가 두 가지 일이 동시에 일어날 확률에 관심이 있다는 사실에서 유래합니다.
예를 들어, 총 100명 중 13명이 남성 이었고 가장 좋아하는 스포츠로 야구를 선택했습니다.
따라서 특정 개인이 남성 이고 좋아하는 스포츠로 야구를 선택할 공동 확률은 13/100 = 0.13 또는 13% 라고 말할 수 있습니다.
수학 표기법으로 작성:
P(성별 = 남성, 스포츠 = 야구) = 13/100 = 0.13 .
이 프로세스를 사용하여 전체 결합 확률 분포를 계산할 수 있습니다.
- P(성별 = 남성, 스포츠 = 야구) = 13/100 = 0.13
- P(성별 = 남성, 스포츠 = 농구) = 15/100 = 0.15
- P(성별 = 남성, 스포츠 = 축구) = 20/100 = 0.20
- P(성별 = 여성, 스포츠 = 야구) = 23/100 = 0.23
- P(성별 = 여성, 스포츠 = 농구) = 16/100 = 0.16
- P(성별 = 여성, 스포츠 = 축구) = 13/100 = 0.13
확률의 합은 1 즉 100% 입니다.
결합 확률 분포를 사용하는 이유는 무엇입니까?
결합 확률 분포는 두 가지 변수(예: 스포츠, 성별)에 대한 데이터를 수집하고 두 변수와 관련된 질문에 답하려는 경우가 많기 때문에 유용합니다.
예를 들어, 인구 중 특정 개인이 남성 이고 좋아하는 스포츠로 야구를 선호할 확률을 이해하고 싶을 수 있습니다.
또는 특정 개인이 여성 이고 좋아하는 스포츠로 축구를 선호할 확률을 이해하는 데 관심이 있을 수도 있습니다.
결합 확률 분포는 이러한 질문에 답하는 데 도움이 될 수 있습니다.
결합 확률 분포를 더 잘 이해하려면 다음 예를 연습으로 사용하세요.
실시예 1
다음 양방향 표는 238명에게 어떤 종류의 영화를 선호하는지 묻는 설문 조사 결과를 보여줍니다.
질문: 특정 개인이 여성이고 좋아하는 영화 장르로 드라마를 선호할 확률은 얼마입니까?
답: P(성별=여성, 성별=드라마) = 58/238 = 0.244 = 24.4%
실시예 2
다음 양방향 표는 한 학급에 속한 64명의 학생이 공부한 시간을 기준으로 한 시험 점수를 보여줍니다.
질문: 특정 개인이 2시간 동안 공부하여 91에서 100 사이의 성적을 받을 확률은 얼마나 됩니까?
답: P(학습 = 2시간, 점수 = 91~100) = 3/64 = 0.047 = 4.7%