Как выполнить manova в stata
Однофакторный дисперсионный анализ используется для определения того, приводят ли разные уровни объясняющей переменной к статистически различным результатам в определенных переменных отклика.
Например, нам может быть интересно понять, приводят ли три уровня образования (степень младшего специалиста, степень бакалавра, степень магистра) к статистически различным годовым доходам. В этом случае у нас есть объясняющая переменная и переменная ответа.
- Независимая переменная: уровень образования
- Переменная ответа: годовой доход
MANOVA — это расширение однофакторного дисперсионного анализа, в котором имеется более одной переменной отклика. Например, нам может быть интересно понять, приводит ли уровень образования к разным годовым доходам и разным суммам студенческих долгов. В этом случае у нас есть одна объясняющая переменная и две переменные отклика:
- Независимая переменная: уровень образования
- Переменные ответа: годовой доход, студенческий долг.
Поскольку у нас есть более одной переменной ответа, в этом случае было бы уместно использовать MANOVA.
Далее мы объясним, как выполнить MANOVA в Stata.
Пример: MANOVA в Stata
Чтобы проиллюстрировать, как выполнить MANOVA в Stata, мы будем использовать следующий набор данных, который содержит следующие три переменные для 24 человек:
- образование: уровень обучения (0 = ассоциированный специалист, 1 = бакалавр, 2 = магистр)
- доход: годовой доход
- долг: общая задолженность по студенческому кредиту
Вы можете воспроизвести этот пример, введя данные вручную, выбрав «Данные» > «Редактор данных» > «Редактор данных (Редактировать)» в верхней строке меню.
Чтобы выполнить MANOVA, используя образование в качестве объясняющей переменной, а доход и долг в качестве переменных ответа, мы можем использовать следующую команду:
доход долг manova = образование
Stata выдает четыре уникальные статистические данные испытаний вместе с соответствующими им значениями p:
Лямбда Уилкса: статистика F = 5,02, значение P = 0,0023.
Кривая Пиллаи: статистика F = 4,07, значение P = 0,0071.
След Лоули-Хотеллинга: статистика F = 5,94, значение P = 0,0008.
Самый большой корень Роя: F-статистика = 13,10, P-значение = 0,0002.
Подробное объяснение того, как рассчитывается статистика каждого теста, можно найти в этой статье Научного колледжа штата Пенсильвания в Эберли.
Значение p для каждой тестовой статистики меньше 0,05, поэтому нулевая гипотеза будет отклонена независимо от того, какую из них вы используете. Это означает, что у нас есть достаточно доказательств, чтобы сказать, что уровень образования вызывает статистически значимые различия в годовом доходе и общей студенческой задолженности.
Примечание о значениях p: буква рядом со значением p в выходной таблице указывает, как была рассчитана статистика F (e = точный расчет, a = приблизительный расчет, u = верхний предел).