실생활에서 발생하는 잘못된 상관관계의 5가지 예


통계에서 허위 상관관계는 한 변수가 실제로 다른 변수를 유발하지 않고 순전히 우연히 발생하는 두 변수 간의 상관관계를 의미합니다.

이러한 유형의 상관관계는 때때로 한 변수가 다른 변수를 유발한다고 제안할 수 있기 때문에 위험합니다. 실제로는 상관관계가 순전히 우연히 존재합니다.

이러한 유형의 변수 간의 상관 관계는 실제 생활에서 항상 발생하는 것으로 나타났습니다.

다음 예에서는 잘못된 상관관계에 대한 다섯 가지 실제 사례를 공유합니다.

예시 1: 마스터리 및 박스오피스 수익

매년 대학이 수여하는 석사학위 총인원과 연간 총 흥행수익에 대한 자료를 수집해 보면 두 변수는 높은 상관관계를 갖고 있음을 알 수 있다.

이는 더 많은 석사 학위를 발급한다고 해서 매년 흥행 수익이 증가한다는 의미는 아닙니다.

가장 그럴듯한 설명은 세계 인구가 매년 증가하고 있다는 것인데, 이는 매년 더 많은 석사 학위가 수여되고 영화를 보러 가는 사람의 수가 대략 같은 비율로 증가하고 있다는 것을 의미합니다.

두 변수 사이의 상관관계는 허위입니다.

사례 2: 혼인율과 관련된 홍역 사례

미국의 총 홍역 건수와 결혼율에 대한 데이터를 매년 수집해 보면 두 변수가 높은 상관관계를 갖고 있음을 알 수 있습니다.

이는 홍역 사례가 감소한다고 해서 결혼율이 낮아진다는 의미는 아닙니다. 두 변수는 독립적입니다.

현대 의학은 단순히 홍역 사례를 감소시키고 다양한 이유로 매년 결혼하는 사람의 수를 줄이고 있습니다.

두 변수 사이의 상관관계는 허위입니다.

예시 3: 고등학교 졸업자와 도넛 섭취량 비교

미국의 총 고등학교 졸업자 수와 총 도넛 소비량에 대한 데이터를 매년 수집하면 두 변수가 높은 상관 관계가 있음을 알 수 있습니다.

이는 고졸자 증가가 미국 내 도넛 소비 증가로 이어진다는 의미는 아니다.

가장 가능성 있는 설명은 미국의 인구가 시간이 지남에 따라 증가했다는 것입니다. 즉, 인구가 증가함에 따라 고등학교 졸업자의 수와 소비되는 도넛의 총 개수가 증가한다는 의미입니다.

이것은 잘못된 상관관계입니다.

사례 4: 비디오 게임 판매와 원자력 생산

전 세계적으로 매년 비디오 게임의 총 판매량과 원자력 발전소에서 생산되는 총 에너지에 대한 데이터를 수집하면 두 변수가 높은 상관 관계가 있음을 알 수 있습니다.

이는 비디오 게임 판매 증가가 원자력 생산량 증가로 이어진다는 의미는 아닙니다.

대신, 매년 세계 인구가 증가함에 따라 더 많은 원자력 발전소가 건설되고 더 많은 비디오 게임이 판매됩니다.

두 변수 모두 시간이 지남에 따라 지속적으로 증가하더라도 하나가 다른 변수의 원인은 아닙니다. 둘 사이의 상관 관계는 가짜입니다.

예시 5: 아케이드 소득 vs. 석탄 광산 채용

미국의 아케이드에서 발생한 총 수익과 미국의 총 석탄 채굴 일자리 수에 대한 데이터를 수집하면 두 변수가 높은 상관 관계가 있음을 알 수 있습니다.

이는 한 변수가 다른 변수를 감소시킨다는 의미는 아닙니다.

대신 아케이드와 탄광은 지난 몇 년간 덜 흔해졌으며, 이는 두 변수가 거의 같은 비율로 감소한 이유를 설명합니다.

두 변수 사이의 상관관계는 허위입니다.

추가 리소스

다음 튜토리얼에서는 다른 통계 개념의 실제 예를 제공합니다.

실생활에서 확률을 활용하는 예
실생활에서 상관관계를 활용한 예
실제 생활에서 평균, 중앙값, 최빈값을 사용하는 예

의견을 추가하다

이메일 주소는 공개되지 않습니다. 필수 필드는 *로 표시됩니다