R에서 부분 상관 관계를 계산하는 방법


통계에서는 두 변수 간의 선형 관계를 측정하기 위해 Pearson 상관 계수를 자주 사용합니다.

그러나 때때로 우리는 세 번째 변수를 제어하면서 두 변수 사이의 관계를 이해하고 싶을 때가 있습니다.

예를 들어, 학생의 현재 수업 성적을 통제하면서 학생의 학습 시간과 최종 시험 성적 사이의 연관성을 측정한다고 가정해 보겠습니다.

이 경우 부분 상관 관계를 사용하여 공부 시간과 최종 시험 성적 간의 관계를 측정할 수 있습니다.

이 튜토리얼에서는 R에서 부분 상관 관계를 계산하는 방법을 설명합니다.

예: R의 부분 상관관계

10명의 학생에 대한 현재 성적, 총 학습 시간 및 최종 시험 성적을 표시하는 다음 데이터 프레임이 있다고 가정합니다.

 #create data frame
df <- data. frame (currentGrade = c(82, 88, 75, 74, 93, 97, 83, 90, 90, 80),
                 hours = c(4, 3, 6, 5, 4, 5, 8, 7, 4, 6),
                 examScore = c(88, 85, 76, 70, 92, 94, 89, 85, 90, 93))

#view data frame
df

   currentGrade hours examScore
1 82 4 88
2 88 3 85
3 75 6 76
4 74 5 70
5 93 4 92
6 97 5 94
7 83 8 89
8 90 7 85
9 90 4 90
10 80 6 93

데이터프레임의 각 쌍별 변수 조합 간의 부분 상관 관계를 계산하려면 ppcor 라이브러리pcor() 함수를 사용할 수 있습니다.

 library (ppcor)

#calculate partial correlations
pcor(df)

$estimate
             currentGrade hours examScore
currentGrade 1.0000000 -0.3112341 0.7355673
hours -0.3112341 1.0000000 0.1906258
examScore 0.7355673 0.1906258 1.0000000

$p.value
             currentGrade hours examScore
currentGrade 0.00000000 0.4149353 0.02389896
hours 0.41493532 0.0000000 0.62322848
examScore 0.02389896 0.6232285 0.00000000

$statistic
             currentGrade hours examScore
currentGrade 0.0000000 -0.8664833 2.8727185
hours -0.8664833 0.0000000 0.5137696
examScore 2.8727185 0.5137696 0.0000000

$n
[1] 10

$gp
[1] 1

$method
[1] "pearson"

결과를 해석하는 방법은 다음과 같습니다.

공부 시간과 최종 시험 성적 사이의 부분 상관 관계:

공부 시간과 최종 시험 성적 사이의 부분 상관 관계는 0.191 로, 작은 양의 상관 관계를 나타냅니다. 현재 성적이 일정하다고 가정할 때, 공부 시간이 늘어날수록 시험 점수도 높아지는 경향이 있다.

이 부분 상관관계에 대한 p-값은 0.623 이며, 이는 α = 0.05에서 통계적으로 유의하지 않습니다.

현재 성적과 최종 시험 성적 간의 부분 상관 관계:

현재 성적과 기말고사 성적의 편상관은 0.736 으로 강한 양의 상관관계를 나타낸다. 공부한 시간이 일정하다고 가정할 때, 현재 등급이 올라갈수록 시험 점수도 높아지는 경향이 있습니다.

이 부분 상관관계에 대한 p-값은 0.024 이며, 이는 α = 0.05에서 통계적으로 유의합니다.

현재 학년과 공부 시간 사이의 부분 상관관계:

현재 성적, 공부시간, 기말고사 성적 간의 편상관은 -0.311 로 약간의 음의 상관관계를 나타냅니다. 기말고사 성적이 일정하다고 가정할 때 현재 성적이 올라갈수록 기말고사 성적은 낮아지는 경향을 보인다.

이 부분 상관관계에 대한 p-값0.415 이며, 이는 α = 0.05에서 통계적으로 유의하지 않습니다.

결과는 또한 부분 상관 관계를 계산하는 데 사용된 방법이 “Pearson”임을 알려줍니다.

pcor() 함수에서 상관 관계를 계산하는 대체 방법으로 “kendall” 또는 “pearson”을 지정할 수도 있습니다.

추가 리소스

다음 튜토리얼에서는 R에서 다른 일반적인 작업을 수행하는 방법을 설명합니다.

R에서 Spearman 순위 상관 관계를 계산하는 방법
R에서 교차 상관을 계산하는 방법
R에서 슬라이딩 상관관계를 계산하는 방법
R에서 점-이중 상관 관계를 계산하는 방법

의견을 추가하다

이메일 주소는 공개되지 않습니다. 필수 필드는 *로 표시됩니다