Kendall의 tau: 정의 + 예


통계에서 상관관계는 두 변수 사이의 관계의 강도와 방향을 나타냅니다. 상관 계수 값의 범위는 -1에서 1까지이며, -1은 완벽한 음의 관계를 나타내고, 0은 관계가 없음을 나타내고, 1은 완벽한 양의 관계를 나타냅니다.

가장 일반적으로 사용되는 상관 계수는 두 수치 변수 간의 선형 연관성을 측정하는 Pearson 상관 계수 입니다.

덜 일반적으로 사용되는 상관 계수는 순위가 지정된 데이터의 두 열 간의 관계를 측정하는 Kendall의 Tau 입니다.

종종 τ로 축약되는 Kendall의 타우 계산 공식은 다음과 같습니다.

τ = (CD) / (C+D)

금:

C = 일치하는 쌍의 수

D = 불일치 쌍의 수

다음 예에서는 이 공식을 사용하여 순위가 지정된 데이터의 두 열에 대한 Kendall의 Tau 순위 상관 계수를 계산하는 방법을 보여줍니다.

Kendall의 타우 계산 예

두 명의 농구 코치가 선수 중 최악부터 최고까지 순위를 12로 매겼다고 가정합니다. 다음 표는 각 코치가 선수에게 할당한 순위를 보여줍니다.

Kendall의 타우 예

두 개의 순위 데이터 열을 사용하여 작업하고 있으므로 Kendall의 Tau를 사용하여 두 코치 순위 간의 상관 관계를 계산하는 것이 적절합니다. Kendall의 타우를 계산하려면 다음 단계를 따르십시오.

1단계: 일치하는 쌍의 수를 셉니다.

코치 #2의 순위만 보세요. 첫 번째 플레이어부터 시작하여 그보다 낮은 순위가 몇 개인지 세어보세요. 예를 들어, “1” 아래에 더 큰 숫자 11개가 있으므로 11이라고 씁니다.

Kendall 타우 데이터세트

다음 플레이어로 넘어가서 이 과정을 반복하세요. “2” 아래에는 더 큰 숫자 10개가 있으므로 10을 씁니다.

Kendalls 타우 일치 쌍 계산

이전 플레이어보다 순위가 낮은 플레이어에 도달하면 그에게는 이전 플레이어와 동일한 값이 할당됩니다. 예를 들어 Elliot의 순위는 이전 플레이어의 순위 “5”보다 낮은 “4”이므로 이전 플레이어와 동일한 값이 할당됩니다.

켄달의 타우

모든 플레이어에 대해 이 과정을 반복합니다.

켄달의 타우

2단계: 일치하지 않는 쌍의 수를 셉니다.

이번에도 코치 #2의 순위만 살펴보세요. 각 플레이어에 대해 그보다 낮은 순위가 몇 개인지 세어보세요. 예를 들어, 코치 #2는 AJ에게 순위 “1”을 할당했고 그 아래에는 더 낮은 순위를 가진 선수가 없습니다. 따라서 우리는 값을 0으로 할당합니다.

불일치 쌍에 대한 Kendall의 타우 계산

각 플레이어에 대해 이 과정을 반복합니다.

Kendall의 타우 예

3단계: 각 열의 합을 계산하고 Kendall의 타우를 찾습니다.

Kendall의 타우 계산

Kendall의 타우 = (CD) / (C+D) = (63-3) / (63+3) = (60/66) = 0.909 .

Kendall’s Tau의 통계적 중요성

n=10개 이상의 쌍이 있는 경우 Kendall의 Tau는 일반적으로 정규 분포를 따릅니다. 다음 공식을 사용하여 Kendall의 Tau에 대한 z-점수를 계산할 수 있습니다.

z = 3τ*√ n(n-1) / √ 2(2n+5)

금:

τ = Kendall의 Tau에 대해 계산한 값

n = 쌍의 수

이전 예에서 z를 계산하는 방법은 다음과 같습니다.

z = 3(.909)*√ 12(12-1) / √ 2(2*12+5) = 4.11 .

P-값 Z-점수 계산기를 사용하면 이 z-점수에 대한 p-값이 0.00004 이며 이는 0.05 알파 수준에서 통계적으로 유의미하다는 것을 알 수 있습니다. 따라서 두 코치가 선수들에게 부여한 순위 사이에는 통계적으로 유의미한 상관관계가 존재한다.

보너스: R에서 Kendall의 Tau를 계산하는 방법

R 통계 소프트웨어에서는 VGAM 라이브러리의 kendall.tau() 함수를 사용하여 다음 구문을 사용하는 두 벡터에 대한 Kendall의 Tau를 계산할 수 있습니다.

켄달.타우(x, y)

여기서 xy 는 동일한 길이의 두 디지털 벡터입니다.

다음 코드는 이전 예에서 사용한 정확한 데이터에 대해 Kendall의 Tau를 계산하는 방법을 보여줍니다.

 #load VGAM
library(VGAM)

#create vector for each coach's rankings
coach_1 <- c(1, 2, 3, 4, 5, 6, 7, 8, 9, 10, 11, 12)
coach_2 <- c(1, 2, 3, 5, 4, 7, 6, 8, 10, 9, 11, 12)

#calculate Kendall's Tau
kendall.tau(coach_1, coach_2)

#[1] 0.9090909

Kendall의 Tau 값이 수동으로 계산한 값과 어떻게 일치하는지 확인하세요.

의견을 추가하다

이메일 주소는 공개되지 않습니다. 필수 필드는 *로 표시됩니다