Come creare un grafico di interazione in r
Un’ANOVA a due vie viene utilizzata per determinare se esiste una differenza tra le medie di tre o più gruppi indipendenti che sono stati divisi su due fattori.
Utilizziamo l’ANOVA bidirezionale quando vogliamo sapere se due fattori specifici influenzano una determinata variabile di risposta.
Tuttavia, a volte si verifica un effetto di interazione tra i due fattori, che può influenzare il modo in cui interpretiamo la relazione tra i fattori e la variabile di risposta.
Ad esempio, potremmo voler sapere se i fattori (1) esercizio fisico e (2) sesso influenzano la variabile di risposta perdita di peso . Sebbene sia possibile che entrambi i fattori influenzino la perdita di peso, è anche possibile che interagiscano tra loro.
Ad esempio, è possibile che l’esercizio fisico causi la perdita di peso a ritmi diversi negli uomini e nelle donne. In questo caso, esiste un effetto di interazione tra esercizio fisico e genere.
Il modo più semplice per rilevare e comprendere gli effetti di interazione tra due fattori è utilizzare un grafico di interazione .
Si tratta di un tipo di grafico che visualizza i valori adattati di una variabile di risposta sull’asse y e i valori del primo fattore sull’asse x. Intanto le linee nel grafico rappresentano i valori del secondo fattore di interesse.
Questo tutorial spiega come creare e interpretare un grafico di interazione in R.
Esempio: grafico delle interazioni in R
Diciamo che i ricercatori vogliono determinare se l’intensità dell’esercizio e il sesso influiscono sulla perdita di peso. Per testarlo, hanno reclutato 30 uomini e 30 donne per partecipare a un esperimento in cui hanno assegnato casualmente 10 di loro a seguire un programma senza esercizio fisico, esercizio leggero o intenso per un mese.
Utilizzare i passaggi seguenti per creare un frame di dati in R, eseguire un’ANOVA bidirezionale e creare un grafico di interazione per visualizzare l’effetto di interazione tra esercizio e genere.
Passaggio 1: creare i dati.
Il codice seguente mostra come creare un frame di dati in R:
#make this example reproducible set.seed(10) #create data frame data <- data.frame(gender = rep (c("Male", "Female"), each = 30 ), exercise = rep (c("None", "Light", "Intense"), each = 10 , times = 2 ), weight_loss = c(runif(10, -3, 3), runif(10, 0, 5), runif(10, 5, 9), runif(10, -4, 2), runif(10, 0, 3), runif(10, 3, 8))) #view first six rows of data frame head(data) gender exercise weight_loss 1 Male None 0.04486922 2 Male None -1.15938896 3 Male None -0.43855400 4 Male None 1.15861249 5 Male None -2.48918419 6 Male None -1.64738030
Passaggio 2: adattare il modello ANOVA a due vie.
Il codice seguente mostra come adattare un’ANOVA bidirezionale ai dati:
#fit the two-way ANOVA model model <- aov(weight_loss ~ gender * exercise, data = data) #view the model output summary(model) # Df Sum Sq Mean Sq F value Pr(>F) #gender 1 15.8 15.80 11.197 0.0015 ** #exercise 2 505.6 252.78 179.087 <2e-16 *** #gender:exercise 2 13.0 6.51 4.615 0.0141 * #Residuals 54 76.2 1.41 #--- #Significant. codes: 0 '***' 0.001 '**' 0.01 '*' 0.05 '.' 0.1 ' ' 1
Si noti che il valore p ( 0,0141 ) per il termine di interazione tra esercizio e genere è statisticamente significativo, indicando che esiste un effetto di interazione significativo tra i due fattori.
Passaggio 3: crea il grafico dell’interazione.
Il codice seguente mostra come creare un grafico di interazione per esercizio e genere:
interaction.plot(x.factor = data$exercise, #x-axis variable trace.factor = data$gender, #variable for lines response = data$weight_loss, #y-axis variable fun = median, #metric to plot ylab = "Weight Loss", xlab = "Exercise Intensity", col = c("pink", "blue"), lty = 1, #line type lwd = 2, #linewidth trace.label = "Gender")
In generale, se le due linee del grafico dell’interazione sono parallele, non vi è alcun effetto di interazione. Tuttavia, se le linee si incrociano, è probabile che si verifichi un effetto di interazione.
Possiamo vedere da questo grafico che le linee per uomini e donne si incrociano, indicando che esiste probabilmente un effetto di interazione tra le variabili di intensità dell’esercizio e il genere.
Ciò corrisponde al fatto che il valore p nel risultato della tabella ANOVA era statisticamente significativo per il termine di interazione nel modello ANOVA.
Risorse addizionali
Come eseguire l’ANOVA unidirezionale in R
Come eseguire l’ANOVA bidirezionale in R