Как создать график взаимодействия в r
Двусторонний дисперсионный анализ используется для определения разницы между средними значениями трех или более независимых групп, разделенных по двум факторам.
Мы используем двусторонний дисперсионный анализ, когда хотим узнать, влияют ли два конкретных фактора на определенную переменную ответа.
Однако иногда между двумя факторами существует эффект взаимодействия , который может повлиять на то, как мы интерпретируем взаимосвязь между факторами и переменной ответа.
Например, мы могли бы захотеть узнать, влияют ли факторы (1) физические упражнения и (2) пол на переменную ответа — потерю веса . Хотя возможно, что оба фактора влияют на потерю веса, также возможно, что они взаимодействуют друг с другом.
Например, возможно, что физические упражнения вызывают потерю веса с разной скоростью у мужчин и женщин. В этом случае существует эффект взаимодействия между физическими упражнениями и полом.
Самый простой способ обнаружить и понять эффекты взаимодействия между двумя факторами — использовать граф взаимодействия .
Это тип графика, который отображает подобранные значения переменной отклика по оси Y и значения первого фактора по оси X. Между тем, линии на графике представляют значения второго интересующего фактора.
В этом руководстве объясняется, как создать и интерпретировать график взаимодействия в R.
Пример: график взаимодействия в R
Допустим, исследователи хотят определить, влияют ли интенсивность упражнений и пол на потерю веса. Чтобы проверить это, они набрали 30 мужчин и 30 женщин для участия в эксперименте, в котором 10 из них случайным образом назначили выполнять программу упражнений без упражнений, легких упражнений или интенсивных упражнений в течение месяца.
Используйте следующие шаги, чтобы создать фрейм данных в R, выполнить двусторонний дисперсионный анализ и создать график взаимодействия, чтобы визуализировать эффект взаимодействия между упражнениями и полом.
Шаг 1: Создайте данные.
Следующий код показывает, как создать фрейм данных в R:
#make this example reproducible set.seed(10) #create data frame data <- data.frame(gender = rep (c("Male", "Female"), each = 30 ), exercise = rep (c("None", "Light", "Intense"), each = 10 , times = 2 ), weight_loss = c(runif(10, -3, 3), runif(10, 0, 5), runif(10, 5, 9), runif(10, -4, 2), runif(10, 0, 3), runif(10, 3, 8))) #view first six rows of data frame head(data) gender exercise weight_loss 1 Male None 0.04486922 2 Male None -1.15938896 3 Male None -0.43855400 4 Male None 1.15861249 5 Male None -2.48918419 6 Male None -1.64738030
Шаг 2: Подберите двуфакторную модель ANOVA.
Следующий код показывает, как подогнать к данным двусторонний дисперсионный анализ:
#fit the two-way ANOVA model model <- aov(weight_loss ~ gender * exercise, data = data) #view the model output summary(model) # Df Sum Sq Mean Sq F value Pr(>F) #gender 1 15.8 15.80 11.197 0.0015 ** #exercise 2 505.6 252.78 179.087 <2e-16 *** #gender:exercise 2 13.0 6.51 4.615 0.0141 * #Residuals 54 76.2 1.41 #--- #Significant. codes: 0 '***' 0.001 '**' 0.01 '*' 0.05 '.' 0.1 ' ' 1
Обратите внимание, что значение p ( 0,0141 ) для термина взаимодействия между физическими упражнениями и полом является статистически значимым, что указывает на наличие значительного эффекта взаимодействия между двумя факторами.
Шаг 3: Создайте график взаимодействия.
Следующий код показывает, как создать график взаимодействия для упражнений и пола:
interaction.plot(x.factor = data$exercise, #x-axis variable trace.factor = data$gender, #variable for lines response = data$weight_loss, #y-axis variable fun = median, #metric to plot ylab = "Weight Loss", xlab = "Exercise Intensity", col = c("pink", "blue"), lty = 1, #line type lwd = 2, #linewidth trace.label = "Gender")
В общем, если две линии графика взаимодействия параллельны, эффекта взаимодействия нет. Однако если линии пересекаются, вероятно, имеет место эффект взаимодействия.
На этом графике мы видим, что линии для мужчин и женщин пересекаются, что указывает на то, что, вероятно, существует эффект взаимодействия между переменными интенсивности упражнений и полом.
Это соответствует тому факту, что значение p в результате таблицы ANOVA было статистически значимым для члена взаимодействия в модели ANOVA.
Дополнительные ресурсы
Как выполнить односторонний дисперсионный анализ в R
Как выполнить двусторонний дисперсионный анализ в R