Python에서 점-이중 상관 관계를 계산하는 방법
점-이차 상관은 이진 변수 x와 연속 변수 y 사이의 관계를 측정하는 데 사용됩니다.
Pearson 상관 계수 와 유사하게 점-이중 상관 계수는 -1과 1 사이의 값을 갖습니다. 여기서:
- -1은 두 변수 사이의 완벽한 음의 상관관계를 나타냅니다.
- 0은 두 변수 사이에 상관관계가 없음을 나타냅니다.
- 1은 두 변수 사이의 완벽한 양의 상관 관계를 나타냅니다.
이 튜토리얼에서는 Python에서 두 변수 간의 점-이중 상관 관계를 계산하는 방법을 설명합니다.
예: Python의 점-이중 상관 관계
이진 변수 x와 연속 변수 y가 있다고 가정합니다.
x = [0, 1, 1, 0, 0, 0, 1, 0, 1, 1, 0] y = [12, 14, 17, 17, 11, 22, 23, 11, 19, 8, 12]
scipy.stats 라이브러리의 pointbiserialr() 함수를 사용하여 두 변수 간의 점-이진 상관 관계를 계산할 수 있습니다.
이 함수는 해당 p-값과 함께 상관 계수를 반환합니다.
import scipy.stats as stats #calculate point-biserial correlation stats. pointbiserialr (x,y) PointbiserialrResult(correlation=0.21816, pvalue=0.51928)
점-이중열 상관 계수는 0.21816 이고 해당 p-값은 0.51928 입니다.
상관계수는 양수이므로 변수 x가 “1”의 값을 가질 때, 변수 y는 변수 x가 “0”의 값을 가질 때보다 더 높은 값을 취하는 경향이 있음을 나타낸다.
이 상관관계의 p-값은 0.05 이상이므로 이 상관관계는 통계적으로 유의하지 않습니다.
scipy.stats 문서 에서 이 상관 관계가 계산되는 방법에 대한 정확한 세부 정보를 찾을 수 있습니다 .