이변량 분석에 대한 빠른 소개


이변량 분석이라는 용어는 두 변수에 대한 분석을 의미합니다. 접두사 “bi”가 “둘”을 의미하기 때문에 이것을 기억할 수 있습니다.

이변량 분석의 목표는 두 변수 간의 관계를 이해하는 것입니다. 이 유형의 분석을 다음과 비교할 수 있습니다.

  • 단변량 분석 : 하나의 변수에 대한 분석입니다.
  • 다변량 분석: 두 개 이상의 변수를 분석합니다.

이변량 분석을 수행하는 세 가지 일반적인 방법은 다음과 같습니다.

1. 산점도.

2. 상관계수.

3. 단순 선형 회귀.

이 자습서에서는 두 가지 변수( (1) 공부에 소비한 시간 및 (2) 20명의 학생이 얻은 시험 점수)에 대한 정보가 포함된 다음 데이터 세트를 사용하여 이러한 각 유형의 이변량 분석에 대한 예를 제공합니다.

1. 포인트 클라우드

산점도는 이변량 분석을 수행하는 시각적 방법을 제공합니다. 한 변수의 값을 x축에, 다른 변수의 값을 y축에 배치하여 두 변수 간의 관계를 시각화할 수 있습니다.

아래 산점도에서는 학습 시간을 x축에, 시험 결과를 y축에 배치합니다.

산점도를 사용한 이변량 분석

우리는 두 변수 사이에 긍정적인 관계가 있음을 분명히 알 수 있습니다. 학습 시간이 증가할수록 시험 점수도 증가하는 경향이 있습니다.

2. 상관계수

상관 계수는 이변량 분석을 수행하는 또 다른 방법을 제공합니다. 가장 일반적인 유형의 상관 계수는 두 변수 간의 선형 연관성을 측정하는 피어슨 상관 계수 입니다.   -1과 1 사이의 값을 가집니다. 여기서:

  • -1은 두 변수 사이의 완벽한 음의 선형 상관 관계를 나타냅니다.
  • 0은 두 변수 사이에 선형 상관관계가 없음을 나타냅니다.
  • 1은 두 변수 사이의 완벽한 양의 선형 상관 관계를 나타냅니다.

이 간단한 측정법을 통해 두 변수가 어떻게 관련되어 있는지에 대한 좋은 아이디어를 얻을 수 있습니다. 실제로 우리는 두 변수 사이의 관계를 이해하기 위해 종종 산점도 상관 계수를 사용하여 관계를 시각화 하고 정량화합니다.

3. 단순 선형 회귀

이변량 분석을 수행하는 세 번째 방법은 단순 선형 회귀를 사용하는 것입니다.

이 방법을 사용하여 하나의 변수를 설명 변수 로 선택하고 다른 변수를 응답 변수 로 선택합니다. 그런 다음 데이터 세트에 가장 잘 맞는 행을 찾은 다음 이를 사용하여 두 변수 간의 정확한 관계를 이해할 수 있습니다.

예를 들어 위 데이터 세트에 가장 적합한 행은 다음과 같습니다.

시험 점수 = 69.07 + 3.85*(공부한 시간)

이는 공부한 시간이 추가될 때마다 평균 시험 점수가 3.85점 증가한다는 것을 의미합니다. 이 선형 회귀 모델을 적용함으로써 공부한 시간과 시험 성적 사이의 정확한 관계를 정량화할 수 있습니다.

관련: Excel에서 단순 선형 회귀를 수행하는 방법

결론

이변량 분석은 통계에서 가장 일반적으로 사용되는 분석 유형 중 하나입니다. 왜냐하면 우리는 종종 두 변수 간의 관계를 이해하려고 하기 때문입니다.

산점도, 상관 계수 및 단순 선형 회귀를 사용하여 두 변수 간의 관계를 시각화하고 정량화할 수 있습니다.

종종 이 세 가지 방법은 두 변수 간의 관계에 대한 완전한 그림을 얻기 위해 분석에서 함께 사용됩니다. 따라서 각 방법을 숙지해 두는 것이 좋습니다.

의견을 추가하다

이메일 주소는 공개되지 않습니다. 필수 필드는 *로 표시됩니다