Come calcolare i rapporti di probabilità in r (con esempio)
In statistica, un odds ratio ci dice il rapporto tra le probabilità che un evento si verifichi in un gruppo di trattamento e le probabilità che un evento si verifichi in un gruppo di controllo.
Spesso calcoliamo un rapporto probabilità quando eseguiamo l’analisi su una tabella 2 per 2, che assume il seguente formato:
Per calcolare un rapporto odd in R, possiamo utilizzare la funzione oddsratio() dal pacchetto epitools .
L’esempio seguente mostra come utilizzare questa sintassi nella pratica.
Esempio: calcolare un rapporto odd in R
Diciamo che 50 giocatori di basket utilizzano un nuovo programma di allenamento e 50 giocatori utilizzano un vecchio programma di allenamento. Alla fine del programma, testiamo ogni giocatore per vedere se supera un determinato test di abilità.
La tabella seguente mostra il numero di giocatori che hanno superato e fallito, in base al programma utilizzato:
Diciamo che vogliamo calcolare un rapporto probabilità per confrontare le possibilità che un giocatore superi il test di abilità utilizzando il nuovo programma rispetto a quelle che utilizzano il vecchio programma.
Ecco come creare questa matrice in R:
#create matrix program <- c(' New Program ', ' Old Program ') outcome <- c(' Pass ', ' Fail ') data <- matrix(c(34, 16, 39, 11), nrow= 2 , ncol= 2 , byrow= TRUE ) dimnames(data) <- list(' Program '=program, ' Outcome '=outcome) #view matrix data Outcome Program Pass Fail New Program 34 16 Old Program 39 11
Ed ecco come calcolare l’odds ratio utilizzando la funzione oddsratio() dal pacchetto epitools :
install. packages (' epitools ') library (epitools) #calculate odds ratio oddsratio(data) $measure odds ratio with 95% CI Program estimate lower upper New Program 1.0000000 NA NA Old Program 0.6045506 0.2395879 1.480143 $p.value two-sided Program midp.exact fisher.exact chi.square New Program NA NA NA Old Program 0.271899 0.3678219 0.2600686 $correction [1] FALSE attr(,"method") [1] “median-unbiased estimate & mid-p exact CI”
L’odds ratio risulta essere 0.6045506 .
Interpretiamo questo nel senso che le probabilità che un giocatore superi il test utilizzando il nuovo programma sono solo 0,6045506 volte le probabilità che un giocatore superi il test utilizzando il vecchio programma.
In altre parole, le possibilità che un giocatore superi il test vengono effettivamente ridotte di circa il 39,6% grazie all’utilizzo del nuovo programma.
Possiamo anche utilizzare i valori nelle colonne inferiore e superiore del risultato per costruire il seguente intervallo di confidenza al 95% per l’odds ratio:
Intervallo di confidenza al 95% per l’odds ratio: [0,24, 1,48] .
Siamo sicuri al 95% che il vero odds ratio tra il nuovo e il vecchio programma di allenamento sia contenuto in questo intervallo.
La colonna midp.exact nell’output mostra anche il valore p associato al rapporto odd.
Questo valore p risulta essere 0,271899 . Poiché questo valore non è inferiore a 0,05, concluderemmo che l’odds ratio non è statisticamente significativo.
In altre parole, sappiamo dall’odds ratio che le possibilità di successo di un giocatore utilizzando il nuovo programma sono inferiori rispetto alle possibilità di successo utilizzando il vecchio programma, ma la differenza tra queste possibilità non è in realtà statisticamente significativa.
Risorse addizionali
I seguenti tutorial forniscono ulteriori informazioni sui rapporti di probabilità:
Odds ratio e rischio relativo: qual è la differenza?
La guida completa: come riportare i rapporti di probabilità
Come calcolare un intervallo di confidenza per un odds ratio