Hoe maak je een interactieplot in r
Een tweerichtings-ANOVA wordt gebruikt om te bepalen of er een verschil is tussen de gemiddelden van drie of meer onafhankelijke groepen die op twee factoren zijn verdeeld.
We gebruiken tweerichtings-ANOVA als we willen weten of twee specifieke factoren een bepaalde responsvariabele beïnvloeden.
Soms is er echter sprake van een interactie-effect tussen de twee factoren, wat van invloed kan zijn op de manier waarop we de relatie tussen de factoren en de responsvariabele interpreteren.
We willen bijvoorbeeld weten of de factoren (1) lichaamsbeweging en (2) seks de responsvariabele gewichtsverlies beïnvloeden. Hoewel het mogelijk is dat beide factoren het gewichtsverlies beïnvloeden, is het ook mogelijk dat ze met elkaar interageren.
Het is bijvoorbeeld mogelijk dat lichaamsbeweging bij mannen en vrouwen in een verschillend tempo gewichtsverlies veroorzaakt. In dit geval is er sprake van een interactie-effect tussen lichaamsbeweging en geslacht.
De eenvoudigste manier om interactie-effecten tussen twee factoren te detecteren en te begrijpen, is door een interactiegrafiek te gebruiken.
Dit is een type plot dat de gepaste waarden van een responsvariabele op de y-as en de waarden van de eerste factor op de x-as weergeeft. Ondertussen vertegenwoordigen de lijnen in de grafiek de waarden van de tweede interessante factor.
In deze tutorial wordt uitgelegd hoe u een interactieplot in R maakt en interpreteert.
Voorbeeld: interactieplot in R
Laten we zeggen dat onderzoekers willen bepalen of de trainingsintensiteit en het geslacht invloed hebben op het gewichtsverlies. Om dit te testen, rekruteerden ze 30 mannen en 30 vrouwen om deel te nemen aan een experiment waarbij ze willekeurig 10 van hen een maand lang een programma zonder oefeningen, lichte oefeningen of intensieve oefeningen lieten volgen.
Gebruik de volgende stappen om een dataframe in R te maken, een tweerichtings-ANOVA uit te voeren en een interactieplot te maken om het interactie-effect tussen lichaamsbeweging en geslacht te visualiseren.
Stap 1: Creëer de gegevens.
De volgende code laat zien hoe u een dataframe maakt in R:
#make this example reproducible set.seed(10) #create data frame data <- data.frame(gender = rep (c("Male", "Female"), each = 30 ), exercise = rep (c("None", "Light", "Intense"), each = 10 , times = 2 ), weight_loss = c(runif(10, -3, 3), runif(10, 0, 5), runif(10, 5, 9), runif(10, -4, 2), runif(10, 0, 3), runif(10, 3, 8))) #view first six rows of data frame head(data) gender exercise weight_loss 1 Male None 0.04486922 2 Male None -1.15938896 3 Male None -0.43855400 4 Male None 1.15861249 5 Male None -2.48918419 6 Male None -1.64738030
Stap 2: Monteer het tweeweg-ANOVA-model.
De volgende code laat zien hoe u een tweerichtings-ANOVA aan de gegevens kunt aanpassen:
#fit the two-way ANOVA model model <- aov(weight_loss ~ gender * exercise, data = data) #view the model output summary(model) # Df Sum Sq Mean Sq F value Pr(>F) #gender 1 15.8 15.80 11.197 0.0015 ** #exercise 2 505.6 252.78 179.087 <2e-16 *** #gender:exercise 2 13.0 6.51 4.615 0.0141 * #Residuals 54 76.2 1.41 #--- #Significant. codes: 0 '***' 0.001 '**' 0.01 '*' 0.05 '.' 0.1 ' ' 1
Merk op dat de p-waarde ( 0,0141 ) voor de interactieterm tussen lichaamsbeweging en geslacht statistisch significant is, wat aangeeft dat er een significant interactie-effect is tussen de twee factoren.
Stap 3: Maak het interactieplot.
De volgende code laat zien hoe u een interactieplot voor beweging en geslacht kunt maken:
interaction.plot(x.factor = data$exercise, #x-axis variable trace.factor = data$gender, #variable for lines response = data$weight_loss, #y-axis variable fun = median, #metric to plot ylab = "Weight Loss", xlab = "Exercise Intensity", col = c("pink", "blue"), lty = 1, #line type lwd = 2, #linewidth trace.label = "Gender")
Als de twee lijnen van het interactiediagram evenwijdig zijn, is er over het algemeen geen interactie-effect. Als de lijnen elkaar echter kruisen, is er waarschijnlijk sprake van een interactie-effect.
Uit deze grafiek kunnen we zien dat de lijnen voor mannen en vrouwen elkaar kruisen, wat aangeeft dat er waarschijnlijk een interactie-effect is tussen de variabelen van de trainingsintensiteit en het geslacht.
Dit komt overeen met het feit dat de p-waarde in het ANOVA-tabelresultaat statistisch significant was voor de interactieterm in het ANOVA-model.
Aanvullende bronnen
Eenrichtings-ANOVA uitvoeren in R
Hoe tweeweg-ANOVA uit te voeren in R