Тау кендалла: определение + пример


В статистике корреляция означает силу и направление связи между двумя переменными. Значение коэффициента корреляции может варьироваться от -1 до 1, где -1 указывает на идеальную отрицательную связь, 0 указывает на отсутствие связи и 1 указывает на идеальную положительную связь.

Наиболее часто используемый коэффициент корреляции — это коэффициент корреляции Пирсона , который измеряет линейную связь между двумя числовыми переменными.

Менее часто используемый коэффициент корреляции — Тау Кендалла , который измеряет взаимосвязь между двумя столбцами ранжированных данных.

Формула для расчета тау Кендалла, часто сокращенно τ, выглядит следующим образом:

τ = (CD) / (C+D)

Золото:

C = количество совпадающих пар

D = количество несогласованных пар

В следующем примере показано, как использовать эту формулу для расчета коэффициента ранговой корреляции Тау Кендалла для двух столбцов ранжированных данных.

Пример расчета тау Кендалла

Предположим, что два баскетбольных тренера ранжируют 12 своих игроков от худшего к лучшему. В следующей таблице показаны рейтинги, которые каждый тренер присваивает игрокам:

Пример Тау Кендалла

Поскольку мы работаем с двумя столбцами ранжированных данных, для расчета корреляции между рейтингами двух тренеров уместно использовать Тау Кендалла. Выполните следующие шаги, чтобы рассчитать Тау Кендалла:

Шаг 1: Подсчитайте количество совпадающих пар.

Смотрите только на рейтинги тренера №2. Начиная с первого игрока, посчитайте, на сколько рангов ниже него выше ростом . Например, ниже «1» есть 11 чисел, которые больше, поэтому напишем 11:

Набор данных Кендалла Тау

Перейдите к следующему игроку и повторите процесс. Ниже «2» есть 10 чисел, которые больше, поэтому запишем 10:

Расчет тау-согласных пар Кендалла

Как только мы достигаем игрока, чей ранг ниже , чем у игрока до него, ему просто присваивается то же значение, что и игроку перед ним. Например, Эллиот имеет ранг «4», который ниже, чем ранг предыдущего игрока «5», поэтому ему просто присваивается то же значение, что и игроку до него:

Тау Кендалла

Повторите этот процесс для всех игроков:

Тау Кендалла

Шаг 2: Подсчитайте количество несогласованных пар.

Опять же, обратите внимание только на рейтинг тренера №2. Для каждого игрока подсчитайте, на сколько рангов ниже него или нее меньше . Например, тренер №2 присвоил AJ ранг «1», и ни один игрок ниже него не имеет ранга ниже. Таким образом, мы присваиваем ему значение 0:

Расчет тау Кендалла для дискордантных пар

Повторите этот процесс для каждого игрока:

Пример тау Кендалла

Шаг 3: Рассчитайте сумму каждого столбца и найдите Тау Кендалла.

Расчет тау Кендалла

Тау Кендалла = (CD) / (C+D) = (63-3) / (63+3) = (60/66) = 0,909 .

Статистическая значимость тау Кендалла

Если у вас более n = 10 пар, тау Кендалла обычно подчиняется нормальному распределению. Вы можете использовать следующую формулу для расчета z-показателя тау Кендалла:

z = 3τ*√ n(n-1) / √ 2(2n+5)

Золото:

τ = значение, которое вы рассчитали для Тау Кендалла.

n = количество пар

Вот как вычислить z для предыдущего примера:

z = 3(0,909)*√ 12(12-1) / √ 2(2*12+5) = 4,11 .

Используя калькулятор Z-показателя P-значения, мы видим, что значение p для этого z-показателя составляет 0,00004 , что статистически значимо на уровне альфа 0,05. Таким образом, существует статистически значимая корреляция между рангами, которые два тренера присваивали игрокам.

Бонус: как рассчитать тау Кендалла в R.

В статистическом программном обеспечении R вы можете использовать функцию kendall.tau() из библиотеки VGAM для расчета тау Кендалла для двух векторов, которая использует следующий синтаксис:

Кендалл.тау(х, у)

где x и y — два цифровых вектора одинаковой длины.

Следующий код показывает, как вычислить Тау Кендалла для точных данных, которые мы использовали в предыдущем примере:

 #load VGAM
library(VGAM)

#create vector for each coach's rankings
coach_1 <- c(1, 2, 3, 4, 5, 6, 7, 8, 9, 10, 11, 12)
coach_2 <- c(1, 2, 3, 5, 4, 7, 6, 8, 10, 9, 11, 12)

#calculate Kendall's Tau
kendall.tau(coach_1, coach_2)

#[1] 0.9090909

Обратите внимание, что значение Тау Кендалла соответствует значению, которое мы рассчитали вручную.

Добавить комментарий

Ваш адрес email не будет опубликован. Обязательные поля помечены *