실생활에서 사용되는 이변량 데이터의 5가지 예
이변량 데이터는 정확히 두 개의 변수를 포함하는 데이터 세트를 나타냅니다.
이러한 유형의 데이터는 항상 실제 상황에 나타나며 일반적으로 이러한 유형의 데이터를 분석하기 위해 다음 방법을 사용합니다.
- 포인트 클라우드
- 상관계수
- 단순 선형 회귀
다음 예에서는 이변량 데이터가 실제 생활에 나타나는 다양한 시나리오를 보여줍니다.
예시 1: 비즈니스
회사에서는 종종 광고에 지출된 총 비용과 총 수익에 대한 이변량 데이터를 수집합니다.
예를 들어, 회사는 12개의 연속 판매 분기에 대해 다음 데이터를 수집할 수 있습니다.

이는 광고 지출과 총 수익이라는 정확히 두 가지 변수에 대한 정보를 포함하고 있기 때문에 이변량 데이터의 예입니다.
회사는 이 데이터 세트에 단순 선형 회귀 모델을 적용하기로 결정하고 다음과 같은 적합한 모델을 찾을 수 있습니다.
총 수익 = 14,942.75 + 2.70* (광고비)
이는 광고에 추가로 1달러를 지출할 때마다 총 수익이 평균 2.70달러 증가한다는 것을 회사에 알려줍니다.
예시 2: 의료
의학 연구자들은 건강 관련 변수 간의 관계를 더 잘 이해하기 위해 이변량 데이터를 수집하는 경우가 많습니다.
예를 들어, 연구자는 15명의 사람으로부터 다음과 같은 연령 및 남은 심박수 데이터를 수집할 수 있습니다.

그러면 연구자는 두 변수 사이의 상관관계를 계산하여 0.812 와 같다는 것을 알 수 있습니다.
이는 두 변수 사이에 강한 양의 상관관계가 있음을 나타냅니다. 즉, 연령이 높아질수록 잔존 심박수도 예측 가능하게 증가하는 경향이 있습니다.
관련 항목: “강한” 상관 관계로 간주되는 것은 무엇입니까?
예시 3: 학자
연구자들은 어떤 변수가 대학생 성과에 영향을 미치는지 이해하기 위해 이변량 데이터를 수집하는 경우가 많습니다.
예를 들어, 연구자는 특정 수업을 듣는 학생들의 주당 공부 시간과 해당 GPA에 대한 데이터를 수집할 수 있습니다.

그런 다음 간단한 산점도를 만들어 이 두 변수 간의 관계를 시각화할 수 있습니다.

두 변수 사이에는 분명히 긍정적인 연관성이 있습니다. 즉, 주당 공부 시간이 증가함에 따라 학생의 GPA도 증가하는 경향이 있습니다.
예시 4: 경제
경제학자들은 종종 두 사회경제적 변수 사이의 관계를 이해하기 위해 이변량 데이터를 수집합니다.
예를 들어, 경제학자는 특정 도시에서 개인의 총 교육 기간과 총 연간 소득에 대한 데이터를 수집할 수 있습니다.

그런 다음 그는 다음과 같은 단순 선형 회귀 모델을 적용하기로 결정할 수 있습니다.
연소득 = -45,353 + 7,120*(재학년수)
이는 경제학자가 교육을 1년 더 받을 때마다 연간 소득이 평균 7,120달러 증가한다는 것을 말해줍니다.
실시예 5: 생물학
생물학자들은 두 변수가 식물이나 동물 사이에 어떻게 연관되어 있는지 이해하기 위해 종종 이변량 데이터를 수집합니다.
예를 들어, 생물학자는 다양한 지역의 총 강수량 및 총 식물 수에 대한 데이터를 수집할 수 있습니다.

그러면 생물학자는 두 변수 사이의 상관관계를 계산하여 그 상관관계가 0.926 임을 알아내기로 결정할 수 있습니다.
이는 두 변수 사이에 강한 양의 상관관계가 있음을 나타냅니다.
즉, 더 높은 강수량은 한 지역의 식물 수 증가와 밀접하게 연관되어 있습니다.
추가 리소스
다음 자습서에서는 이변량 데이터와 이를 분석하는 방법에 대한 추가 정보를 제공합니다.