실생활에서 사용되는 이변량 데이터의 5가지 예

에 의해 벤자민 앤더슨 7월 22, 2023 가이드 댓글 0개

이변량 데이터는 정확히 두 개의 변수를 포함하는 데이터 세트를 나타냅니다.

이러한 유형의 데이터는 항상 실제 상황에 나타나며 일반적으로 이러한 유형의 데이터를 분석하기 위해 다음 방법을 사용합니다.

포인트 클라우드
상관계수
단순 선형 회귀

다음 예에서는 이변량 데이터가 실제 생활에 나타나는 다양한 시나리오를 보여줍니다.

예시 1: 비즈니스

회사에서는 종종 광고에 지출된 총 비용과 총 수익에 대한 이변량 데이터를 수집합니다.

예를 들어, 회사는 12개의 연속 판매 분기에 대해 다음 데이터를 수집할 수 있습니다.

이는 광고 지출과 총 수익이라는 정확히 두 가지 변수에 대한 정보를 포함하고 있기 때문에 이변량 데이터의 예입니다.

회사는 이 데이터 세트에 단순 선형 회귀 모델을 적용하기로 결정하고 다음과 같은 적합한 모델을 찾을 수 있습니다.

총 수익 = 14,942.75 + 2.70* (광고비)

이는 광고에 추가로 1달러를 지출할 때마다 총 수익이 평균 2.70달러 증가한다는 것을 회사에 알려줍니다.

예시 2: 의료

의학 연구자들은 건강 관련 변수 간의 관계를 더 잘 이해하기 위해 이변량 데이터를 수집하는 경우가 많습니다.

예를 들어, 연구자는 15명의 사람으로부터 다음과 같은 연령 및 남은 심박수 데이터를 수집할 수 있습니다.

그러면 연구자는 두 변수 사이의 상관관계를 계산하여 0.812 와 같다는 것을 알 수 있습니다.

이는 두 변수 사이에 강한 양의 상관관계가 있음을 나타냅니다. 즉, 연령이 높아질수록 잔존 심박수도 예측 가능하게 증가하는 경향이 있습니다.

관련 항목: “강한” 상관 관계로 간주되는 것은 무엇입니까?

예시 3: 학자

연구자들은 어떤 변수가 대학생 성과에 영향을 미치는지 이해하기 위해 이변량 데이터를 수집하는 경우가 많습니다.

예를 들어, 연구자는 특정 수업을 듣는 학생들의 주당 공부 시간과 해당 GPA에 대한 데이터를 수집할 수 있습니다.

그런 다음 간단한 산점도를 만들어 이 두 변수 간의 관계를 시각화할 수 있습니다.

두 변수 사이에는 분명히 긍정적인 연관성이 있습니다. 즉, 주당 공부 시간이 증가함에 따라 학생의 GPA도 증가하는 경향이 있습니다.

예시 4: 경제

경제학자들은 종종 두 사회경제적 변수 사이의 관계를 이해하기 위해 이변량 데이터를 수집합니다.

예를 들어, 경제학자는 특정 도시에서 개인의 총 교육 기간과 총 연간 소득에 대한 데이터를 수집할 수 있습니다.

그런 다음 그는 다음과 같은 단순 선형 회귀 모델을 적용하기로 결정할 수 있습니다.

연소득 = -45,353 + 7,120*(재학년수)

이는 경제학자가 교육을 1년 더 받을 때마다 연간 소득이 평균 7,120달러 증가한다는 것을 말해줍니다.

실시예 5: 생물학

생물학자들은 두 변수가 식물이나 동물 사이에 어떻게 연관되어 있는지 이해하기 위해 종종 이변량 데이터를 수집합니다.

예를 들어, 생물학자는 다양한 지역의 총 강수량 및 총 식물 수에 대한 데이터를 수집할 수 있습니다.

그러면 생물학자는 두 변수 사이의 상관관계를 계산하여 그 상관관계가 0.926 임을 알아내기로 결정할 수 있습니다.

이는 두 변수 사이에 강한 양의 상관관계가 있음을 나타냅니다.

즉, 더 높은 강수량은 한 지역의 식물 수 증가와 밀접하게 연관되어 있습니다.

추가 리소스

다음 자습서에서는 이변량 데이터와 이를 분석하는 방법에 대한 추가 정보를 제공합니다.

이변량 분석 소개
일변량 분석 소개
피어슨 상관 계수 소개
단순 선형 회귀 소개

저자 소개

벤자민 앤더슨

안녕하세요. 저는 통계학 교수를 퇴직하고 전임 통계 교사로 변신한 벤자민입니다. 통계 분야의 광범위한 경험과 전문 지식을 바탕으로 Statorials를 통해 학생들에게 힘을 실어주기 위해 지식을 공유하고 싶습니다. 더 알아보기