상관관계는 인과관계를 의미하지 않습니다: 5가지 구체적인 예


상관관계는 인과관계를 의미하지 않는다 “라는 문구는 두 변수 사이의 상관관계가 반드시 한 변수가 다른 변수의 원인이 된다는 것을 의미하지 않는다는 점을 강조하기 위해 통계에서 자주 사용됩니다.

이 표현을 더 잘 이해하려면 다음 구체적인 예를 고려하세요.

예시 1: 아이스크림 판매 및 상어 공격

미국에서 매년 월간 아이스크림 판매와 월간 상어 공격에 대한 데이터를 수집하면 두 변수가 높은 상관 관계가 있음을 알 수 있습니다.

이것은 아이스크림을 먹으면 상어 공격이 발생한다는 것을 의미합니까?

부족한. 가장 가능성 있는 설명은 날씨가 따뜻할 때 더 많은 사람들이 아이스크림을 먹고 바다에서 수영한다는 것입니다. 이는 이 두 변수가 왜 그렇게 높은 상관 관계를 가지고 있는지 설명합니다.

아이스크림 판매와 상어 공격은 높은 상관관계가 있지만 둘 중 하나가 다른 하나를 유발하지는 않습니다.

예시 2: 마스터리 및 박스오피스 수익

매년 대학이 수여하는 석사학위 총인원과 연간 총 흥행수익에 대한 자료를 수집해 보면 두 변수는 높은 상관관계를 갖고 있음을 알 수 있다.

이는 석사 학위를 더 많이 발급하면 매년 흥행 수익이 증가한다는 것을 의미합니까?

부족한. 가장 그럴듯한 설명은 세계 인구가 매년 증가하고 있다는 것인데, 이는 매년 더 많은 석사 학위가 수여되고 영화를 보러 가는 사람의 수가 대략 같은 비율로 증가하고 있다는 것을 의미합니다.

이 두 변수는 서로 연관되어 있지만 하나가 다른 변수를 유발하지는 않습니다.

사례 3: 원자력 생산과 관련된 수영장에서의 익사

연간 수영장 익사 건수와 원자력 발전소에서 생산되는 총 에너지량에 대한 데이터를 수집하면 두 변수가 높은 상관 관계를 갖고 있음을 알 수 있습니다.

이것은 수영장에서의 익사 증가가 어떻게든 원자력 생산량 증가로 이어진다는 것을 의미합니까?

정확히. 가장 유력한 설명은 세계 인구가 증가했다는 점이다. 이는 수영장에 빠져 익사하는 사람이 더 많아졌다는 뜻이며, 원자력 발전이 해마다 더욱 실용화되고 있다는 점이다.

이 두 변수는 높은 상관관계가 있지만 하나가 다른 변수를 유발하지는 않습니다.

사례 4: 혼인율과 관련된 홍역 사례

미국의 총 홍역 건수와 결혼율에 대한 데이터를 매년 수집해 보면 두 변수가 높은 상관관계를 갖고 있음을 알 수 있습니다.

이는 홍역 사례가 줄어들면 결혼율이 낮아진다는 것을 의미합니까?

정확히. 대신, 두 변수는 독립적입니다. 현대 의학은 홍역 사례의 감소로 이어지고 있으며 다양한 이유로 매년 결혼하는 사람의 수가 줄어들고 있습니다.

이 두 변수는 높은 상관관계가 있지만 하나가 다른 변수를 유발하지는 않습니다.

사례 5: 고등학교 졸업자의 피자 소비량 대비

미국의 총 고등학교 졸업자 수와 총 피자 소비량에 대한 데이터를 매년 수집하면 두 변수가 높은 상관 관계가 있음을 알 수 있습니다.

이것은 고등학교 졸업자의 수가 증가하면서 미국에서 피자 소비가 증가하고 있다는 것을 의미합니까?

부족한. 가장 그럴듯한 설명은 미국의 인구가 시간이 지남에 따라 증가했다는 것인데, 이는 인구가 증가함에 따라 고등학교 졸업자의 수와 피자 소비량이 증가한다는 것을 의미합니다.

이 두 변수는 서로 연관되어 있지만 하나가 다른 변수를 유발하지는 않습니다.

추가 리소스

다음 튜토리얼에서는 상관 관계에 대한 추가 정보를 제공합니다.

피어슨 상관 계수 소개
인과관계는 상관관계를 의미하는가?
상관관계 대 협회 : 차이점은 무엇입니까?
“강한” 상관관계로 간주되는 것은 무엇입니까?
상관관계는 언제 사용해야 합니까?

의견을 추가하다

이메일 주소는 공개되지 않습니다. 필수 필드는 *로 표시됩니다