연속형 변수와 범주형 변수 간의 상관 관계를 계산하는 방법


두 연속형 변수 사이의 상관관계를 계산할 때 일반적으로 Pearson 상관계수를 사용합니다.

그러나 연속형 변수와 범주형 변수 간의 상관 관계를 계산하려면 점 이진 상관 관계 라는 것을 사용할 수 있습니다.

점 이진 상관은 이진 범주형 변수(두 개의 값만 사용할 수 있는 변수)와 연속형 변수 간의 상관 관계를 계산하는 데 사용되며 다음과 같은 속성을 갖습니다.

  • 점-이중 상관 관계는 -1과 1 사이에서 달라질 수 있습니다.
  • 이진 변수에 의해 생성된 각 그룹에 대해 연속 변수는 등분산 정규 분포를 따르는 것으로 가정됩니다.
  • 이진변수에 의해 생성된 각 그룹에 대해 극단적인 특이치가 없는 것으로 가정됩니다.

다음 예에서는 실제로 점-이중 상관 관계를 계산하는 방법을 보여줍니다.

예: 점-이중 상관 관계 계산

한 대학 교수가 성별과 특정 자격 시험 점수 사이에 상관 관계가 있는지 확인하려고 한다고 가정해 보겠습니다.

그는 학급의 남학생 12명과 여학생 12명에 대해 다음 데이터를 수집합니다.

성별은 범주형 변수이고 점수는 연속형 변수이므로 두 변수 간의 점-이중 상관 관계를 계산하는 것이 합리적입니다.

교수는 모든 통계 소프트웨어(Excel, R, Python, SPSS, Stata 포함)를 사용하여 두 변수 간의 점-이중 상관 관계를 계산할 수 있습니다.

다음 코드는 성별 변수에 대해 여성을 나타내는 데 0 값을 사용하고 남성을 나타내는 데 1 값을 사용하여 R에서 점-이중 상관 관계를 계산하는 방법을 보여줍니다.

 #define values for gender
gender <- c(0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0,
            1, 1, 1, 1, 1, 1, 1, 1, 1, 1, 1, 1)

#define values for score
score <- c(77, 78, 79, 79, 82, 84, 85, 88, 89, 91, 91, 94,
           84, 84, 84, 85, 85, 86, 86, 86, 89, 91, 94, 98)

#calculate point-biserial correlation
horn. test (gender, score)

	Pearson's product-moment correlation

data: gender and score
t = 1.3739, df = 22, p-value = 0.1833
alternative hypothesis: true correlation is not equal to 0
95 percent confidence interval:
 -0.1379386 0.6147832
sample estimates:
      horn 
0.2810996

그 결과, 점-이중열 상관계수는 0.281 이고, 이에 상응하는 p-값은 0.1833 임을 알 수 있다.

상관계수가 양수이므로 성별과 점수 간에 양의 상관관계가 있음을 알 수 있습니다.

남성을 1로, 여성을 0으로 코딩했기 때문에 이는 남성의 점수가 더 높은 경향이 있음을 나타냅니다(즉, 성별이 “증가”함에 따라 점수가 증가하는 경향이 있음). » 0에서 1까지).

그러나 p-값이 0.05 이상이므로 이 상관계수는 통계적으로 유의하지 않습니다.

추가 리소스

다음 튜토리얼에서는 다양한 통계 소프트웨어를 사용하여 점 이차 상관 관계를 계산하는 방법을 설명합니다.

Excel에서 점-이중 상관 관계를 계산하는 방법
R에서 점-이중 상관 관계를 계산하는 방법
Python에서 점-이중 상관 관계를 계산하는 방법

의견을 추가하다

이메일 주소는 공개되지 않습니다. 필수 필드는 *로 표시됩니다