Come calcolare la dissomiglianza di bray-curtis in r
La dissomiglianza di Bray-Curtis è un modo per misurare la dissomiglianza tra due siti diversi.
Viene spesso utilizzato in ecologia e biologia per quantificare la differenza tra due siti in termini di specie trovate in tali siti.
Viene calcolato come segue:
BC ij = 1 – (2*C ij ) / (S i + S j )
Oro:
- C ij : La somma dei valori più bassi per le specie rinvenute in ciascun sito.
- S i : il numero totale di esemplari contati nel sito i
- S j : il numero totale di esemplari contati nel sito j
La dissomiglianza di Bray-Curtis è sempre compresa tra 0 e 1 dove:
- 0 indica che due siti non presentano differenze. In altre parole, condividono esattamente lo stesso numero di ciascun tipo di specie.
- 1 indica che due siti presentano una completa dissomiglianza. In altre parole, non condividono alcuna specie dello stesso tipo.
Ad esempio, supponiamo che un botanico esca e conti il numero di cinque diverse specie di piante (A, B, C, D ed E) in due siti diversi.
La tabella seguente riassume i dati raccolti:
Utilizzando questi dati, può calcolare la dissomiglianza di Bray-Curtis come segue:
Integrando questi numeri nella formula di dissomiglianza di Bray-Curtis, otteniamo:
- BC ij = 1 – (2*C ij ) / (S i + S j )
- BC ij = 1 – (2*15) / (21 + 24)
- BC ij = 0,33
La dissomiglianza Bray-Curtis tra questi due siti è 0,33 .
L’esempio seguente mostra come calcolare la dissomiglianza di Bray-Curtis in R.
Esempio: calcolo della dissomiglianza di Bray-Curtis in R
Innanzitutto, creiamo il seguente frame di dati in R per contenere i nostri valori di dati:
#create data frame df <- data. frame (A=c(4, 3), B=c(0, 6), C=c(2, 0), D=c(7, 4), E=c(8, 11)) #view data frame df A B C D E 1 4 0 2 7 8 2 3 6 0 4 11
Possiamo usare il seguente codice per calcolare la dissomiglianza di Bray-Curtis tra le due righe nel frame di dati:
#calculate Bray–Curtis dissimilarity sum( apply (df, 2, function (x) abs ( max (x)- min (x)))) / sum ( rowSums (df)) [1] 0.3333333
Il Bray-Curtis risulta essere diversamente 0,33 .
Questo corrisponde al valore che abbiamo calcolato manualmente in precedenza.
Nota : questa formula funzionerà solo se ciascuna riga nel frame di dati rappresenta un sito separato.
Risorse addizionali
I seguenti tutorial spiegano come calcolare altri parametri di somiglianza in R:
Come calcolare la somiglianza di Jaccard in R
Come calcolare la somiglianza del coseno in R