Как выполнить множественную линейную регрессию в stata


Множественная линейная регрессия — это метод, который можно использовать, чтобы понять взаимосвязь между несколькими объясняющими переменными и переменной отклика.

В этом руководстве объясняется, как выполнить множественную линейную регрессию в Stata.

Пример: множественная линейная регрессия в Stata

Допустим, мы хотим знать, влияют ли мили на галлон и вес на цену автомобиля. Чтобы проверить это, мы можем выполнить множественную линейную регрессию, используя мили на галлон и вес в качестве двух объясняющих переменных и цену в качестве переменной ответа.

Выполните следующие шаги в Stata, чтобы выполнить множественную линейную регрессию, используя набор данных auto , который содержит данные о 74 различных автомобилях.

Шаг 1: Загрузите данные.

Загрузите данные, введя в поле команды следующее:

используйте https://www.stata-press.com/data/r13/auto

Шаг 2. Получите сводку данных.

Получите быстрое представление о данных, с которыми вы работаете, введя следующее в поле «Команда»:

обобщить

Обобщить данные в Stata

Мы видим, что в наборе данных есть 12 различных переменных, но единственные, которые нас интересуют, — это мили на галлон , вес и цена .

Мы можем увидеть следующую базовую сводную статистику по этим трем переменным:

цена | среднее значение = 6165 долларов США, минимум = 3291 доллар США, максимум 15 906 долларов США.

миль на галлон | среднее = 21,29, мин = 12, макс = 41

вес | средний = 3019 фунтов, минимальный = 1760 фунтов, максимальный = 4840 фунтов

Шаг 3: Выполните множественную линейную регрессию.

Введите следующую команду в поле «Команда», чтобы выполнить множественную линейную регрессию, используя миль на галлон и вес в качестве независимых переменных и цену в качестве переменной ответа.

регрессионная цена, вес миль на галлон

Вывод множественной регрессии в Stata

Вот как интерпретировать наиболее интересные цифры в результате:

Вероятность > F: 0,000. Это значение p для общей регрессии. Поскольку это значение меньше 0,05, это указывает на то, что комбинированные объясняющие переменные миль на галлон и веса имеют статистически значимую связь с ответной переменной ценой .

R в квадрате: 0,2934. Это доля дисперсии переменной отклика, которую можно объяснить объясняющими переменными. В этом примере 29,34% изменения цены можно объяснить расходом миль на галлон и весом.

Коэффициент (миль на галлон): -49,512. Это говорит нам о среднем изменении цены, связанном с увеличением расхода миль на галлон на одну единицу, при условии, что вес остается постоянным . В этом примере каждое увеличение расхода миль на галлон на одну единицу связано со средним снижением цены примерно на 49,51 доллара, при условии, что вес остается постоянным.

Например, предположим, что автомобили A и B весят 2000 фунтов. Если автомобиль A расходует 20 миль на галлон, а автомобиль B — только 19 миль на галлон, мы ожидаем, что цена автомобиля A будет на 49,51 доллара меньше, чем цена автомобиля B.

Р>|т| (миль на галлон): 0,567. Это значение p, связанное с тестовой статистикой для миль на галлон. Поскольку это значение не меньше 0,05, у нас нет доказательств того, что расход топлива на галлон имеет статистически значимую связь с ценой.

Коэф (вес): 1,746. Это говорит нам о среднем изменении цены, связанном с увеличением веса на одну единицу, при условии, что количество миль на галлон остается постоянным . В этом примере каждое увеличение веса на одну единицу связано со средним увеличением цены примерно на 1,74 доллара, при условии, что расход топлива остается постоянным.

Например, предположим, что автомобили A и B расходуют по 20 миль на галлон. Если автомобиль А весит на один фунт больше, чем автомобиль Б, то автомобиль А должен стоить на 1,74 доллара дороже.

Р>|т| (вес): 0,008. Это значение p, связанное со статистикой теста на вес. Поскольку это значение меньше 0,05, у нас есть достаточно доказательств, чтобы сказать, что вес имеет статистически значимую связь с ценой.

Коэффициент (_cons): 1946.069. Это говорит нам о средней цене автомобиля, когда расход топлива и вес равны нулю. В этом примере средняя цена составляет 1946 долларов США, когда вес и мили на галлон равны нулю. На самом деле это не имеет смысла интерпретировать, поскольку вес автомобиля и расход миль на галлон не могут быть равны нулю, но число 1946,069 необходимо для формирования уравнения регрессии.

Шаг 4: Сообщите о результатах.

Наконец, мы хотим сообщить о результатах нашей множественной линейной регрессии. Вот пример того, как это сделать:

Множественная линейная регрессия была выполнена для количественной оценки взаимосвязи между весом автомобиля, расходом миль на галлон и его ценой. Для анализа была использована выборка из 74 автомобилей.

Результаты показали, что существует статистически значимая связь между весом и ценой (t = 2,72, p = 0,008), но не было статистически значимой связи между расходом топлива на галлон и ценой (и расходом миль на галлон (t = -0,57, p = 0,567).

Добавить комментарий

Ваш адрес email не будет опубликован. Обязательные поля помечены *