Jak wykonać wielokrotną regresję liniową w stata
Wielokrotna regresja liniowa to metoda, której można użyć do zrozumienia związku między wieloma zmiennymi objaśniającymi a zmienną odpowiedzi.
W tym samouczku wyjaśniono, jak przeprowadzić wielokrotną regresję liniową w programie Stata.
Przykład: wielokrotna regresja liniowa w Stata
Załóżmy, że chcemy wiedzieć, czy mile na galon i masa mają wpływ na cenę samochodu. Aby to przetestować, możemy przeprowadzić wielokrotną regresję liniową, wykorzystując mile na galon i wagę jako dwie zmienne objaśniające oraz cenę jako zmienną odpowiedzi.
Wykonaj poniższe kroki w programie Stata, aby przeprowadzić wielokrotną regresję liniową przy użyciu zbioru danych o nazwie auto , który zawiera dane dotyczące 74 różnych samochodów.
Krok 1: Załaduj dane.
Załaduj dane, wpisując w polu poleceń:
użyj https://www.stata-press.com/data/r13/auto
Krok 2: Uzyskaj podsumowanie danych.
Aby szybko zrozumieć dane, z którymi pracujesz, wpisz następujące polecenie w polu Polecenie:
podsumować
Widzimy, że w zbiorze danych znajduje się 12 różnych zmiennych, ale interesują nas tylko mpg , waga i cena .
Możemy zobaczyć następujące podstawowe statystyki podsumowujące dotyczące tych trzech zmiennych:
cena | średnia = 6165 USD, min = 3291 USD, maksymalnie 15 906 USD
mpg | średnia = 21,29, min = 12, max = 41
waga | średnia = 3019 funtów, min = 1760 funtów, maksymalnie = 4840 funtów
Krok 3: Wykonaj wielokrotną regresję liniową.
Wpisz następujące polecenie w polu Polecenie, aby wykonać wielokrotną regresję liniową, używając mpg i wagi jako zmiennych objaśniających oraz ceny jako zmiennej odpowiedzi.
regresja cena mpg waga
Oto jak zinterpretować najciekawsze liczby w wyniku:
Prawdopodobieństwo > F: 0,000. Jest to wartość p dla ogólnej regresji. Ponieważ wartość ta jest mniejsza niż 0,05, oznacza to, że połączone zmienne objaśniające mpg i waga mają statystycznie istotny związek ze zmienną odpowiedzi cena .
R do kwadratu: 0,2934. Jest to proporcja wariancji zmiennej odpowiedzi, którą można wyjaśnić za pomocą zmiennych objaśniających. W tym przykładzie 29,34% wahań cen można wytłumaczyć mpg i wagą.
Współczynnik (mpg): -49,512. To mówi nam o średniej zmianie ceny związanej ze wzrostem o jedną jednostkę mpg, przy założeniu, że masa pozostaje stała . W tym przykładzie każdy wzrost mpg o jedną jednostkę wiąże się ze średnim spadkiem ceny o około 49,51 USD, przy założeniu, że waga pozostaje stała.
Załóżmy na przykład, że samochody A i B ważą 2000 funtów. Jeśli samochód A zużywa 20 mpg, a samochód B tylko 19 mpg, spodziewamy się, że cena samochodu A będzie o 49,51 dolara niższa niż cena samochodu B.
P>|t| (mpg): 0,567. Jest to wartość p powiązana ze statystyką testową dla mpg. Ponieważ wartość ta jest nie mniejsza niż 0,05, nie mamy dowodów na to, że mpg ma statystycznie istotny związek z ceną.
Współczynnik (waga): 1746. To informuje nas o średniej zmianie ceny związanej ze wzrostem masy o jedną jednostkę, przy założeniu, że mpg pozostaje stałe . W tym przykładzie każdy wzrost masy o jedną jednostkę wiąże się ze średnim wzrostem ceny o około 1,74 dolara, przy założeniu, że mpg pozostaje stałe.
Załóżmy na przykład, że samochody A i B zużywają 20 mpg. Jeśli samochód A waży o jeden funt więcej niż samochód B, to samochód A powinien kosztować o 1,74 dolara więcej.
P>|t| (waga): 0,008. Jest to wartość p powiązana ze statystyką testową dotyczącą masy ciała. Ponieważ wartość ta jest mniejsza niż 0,05, mamy wystarczające dowody, aby stwierdzić, że waga ma statystycznie istotny związek z ceną.
Współczynnik (_cons): 1946.069. To mówi nam średnią cenę samochodu, gdy mpg i masa wynoszą zero. W tym przykładzie średnia cena wynosi 1946 USD, gdy masa i mpg wynoszą zero. Interpretacja tego nie ma sensu, ponieważ masa samochodu i mpg nie mogą wynosić zero, ale do utworzenia równania regresji potrzebna jest liczba 1946,069.
Krok 4: Ogłoś wyniki.
Na koniec chcemy zgłosić wyniki naszej wielokrotnej regresji liniowej. Oto przykład, jak to zrobić:
Przeprowadzono wielokrotną regresję liniową, aby określić ilościowo związek między masą samochodu i mpg a jego ceną. Do analizy wykorzystano próbę 74 samochodów.
Wyniki wykazały, że istnieje istotny statystycznie związek pomiędzy masą a ceną (t = 2,72, p = 0,008), natomiast nie ma istotnego statystycznie związku pomiędzy mpg a ceną (i mpg (t = -0,57, p = 0,567).