Tau di kendall: definizione + esempio


In statistica, la correlazione si riferisce alla forza e alla direzione di una relazione tra due variabili. Il valore di un coefficiente di correlazione può variare da -1 a 1, dove -1 indica una relazione negativa perfetta, 0 indica nessuna relazione e 1 indica una relazione positiva perfetta.

Il coefficiente di correlazione più comunemente utilizzato è il coefficiente di correlazione di Pearson , che misura l’associazione lineare tra due variabili numeriche.

Un coefficiente di correlazione meno comunemente utilizzato è il Tau di Kendall , che misura la relazione tra due colonne di dati classificati.

La formula per calcolare il Tau di Kendall, spesso abbreviato τ, è la seguente:

τ = (CD) / (C+D)

Oro:

C = il numero di coppie corrispondenti

D = il numero di coppie discordanti

L’esempio seguente illustra come utilizzare questa formula per calcolare il coefficiente di correlazione del rango Tau di Kendall per due colonne di dati classificati.

Esempio di calcolo del Tau di Kendall

Si presuppone che due allenatori di basket classifichino 12 dei loro giocatori dal peggiore al migliore. Nella tabella seguente sono riportate le classifiche assegnate da ciascun allenatore ai giocatori:

Esempio Tau di Kendall

Poiché stiamo lavorando con due colonne di dati di classifica, è opportuno utilizzare il Tau di Kendall per calcolare la correlazione tra le classifiche dei due allenatori. Seguire i seguenti passaggi per calcolare il Tau di Kendall:

Passaggio 1: conta il numero di coppie corrispondenti.

Guarda solo la classifica dell’allenatore n.2. Iniziando dal primo giocatore, conta quanti ranghi sotto di lui sono più alti . Ad esempio, ci sono 11 numeri sotto “1” che sono più grandi, quindi scriveremo 11:

Set di dati Kendall Tau

Passa al giocatore successivo e ripeti il processo. Ci sono 10 numeri sotto “2” che sono più grandi, quindi scriveremo 10:

Calcolo delle coppie concordanti tau di Kendalls

Una volta raggiunto un giocatore il cui rango è inferiore a quello del giocatore prima di lui, gli viene semplicemente assegnato lo stesso valore del giocatore prima di lui. Ad esempio, Elliot ha un grado di “4” che è inferiore al grado di “5” del giocatore precedente, quindi gli viene semplicemente assegnato lo stesso valore del giocatore prima di lui:

Il Tau di Kendall

Ripeti questo processo per tutti i giocatori:

Il Tau di Kendall

Passaggio 2: contare il numero di coppie discordanti.

Ancora una volta, guarda solo la classifica dell’allenatore n. 2. Per ogni giocatore, conta quanti ranghi sotto di lui sono più piccoli . Ad esempio, l’allenatore n. 2 ha assegnato ad AJ il grado “1” e nessun giocatore sotto di lui ha un grado inferiore. Pertanto, gli assegniamo il valore 0:

Calcolo del tau di Kendall per coppie discordanti

Ripeti questo procedimento per ogni giocatore:

L'esempio del tau di Kendall

Passaggio 3: calcola la somma di ciascuna colonna e trova il Tau di Kendall.

Calcolo del tau di Kendall

Tau di Kendall = (CD) / (C+D) = (63-3) / (63+3) = (60/66) = 0,909 .

Importanza statistica del Tau di Kendall

Quando hai più di n = 10 coppie, il Tau di Kendall segue generalmente una distribuzione normale. Puoi utilizzare la seguente formula per calcolare un punteggio z per il Tau di Kendall:

z = 3τ*√ n(n-1) / √ 2(2n+5)

Oro:

τ = valore calcolato per il Tau di Kendall

n = numero di coppie

Ecco come calcolare z per l’esempio precedente:

z = 3(.909)*√ 12(12-1) / √ 2(2*12+5) = 4.11 .

Utilizzando il calcolatore del punteggio Z del valore P, vediamo che il valore p per questo punteggio z è 0,00004 , che è statisticamente significativo al livello alfa di 0,05. Esiste quindi una correlazione statisticamente significativa tra i gradi assegnati ai giocatori dai due allenatori.

Bonus: come calcolare il Tau di Kendall in R

Nel software statistico R, è possibile utilizzare la funzione kendall.tau() della libreria VGAM per calcolare il Tau di Kendall per due vettori, che utilizza la seguente sintassi:

kendall.tau(x, y)

dove xey sono due vettori digitali di uguale lunghezza.

Il codice seguente illustra come calcolare il Tau di Kendall per i dati esatti utilizzati nell’esempio precedente:

 #load VGAM
library(VGAM)

#create vector for each coach's rankings
coach_1 <- c(1, 2, 3, 4, 5, 6, 7, 8, 9, 10, 11, 12)
coach_2 <- c(1, 2, 3, 5, 4, 7, 6, 8, 10, 9, 11, 12)

#calculate Kendall's Tau
kendall.tau(coach_1, coach_2)

#[1] 0.9090909

Nota come il valore Tau di Kendall corrisponde al valore che abbiamo calcolato manualmente.

Aggiungi un commento

Il tuo indirizzo email non sarà pubblicato. I campi obbligatori sono contrassegnati *