Jak wykonać regresję kwantylową w stata
Regresja liniowa to metoda, której możemy użyć do zrozumienia związku między jedną lub większą liczbą zmiennych objaśniających a zmienną odpowiedzi.
Zwykle, gdy przeprowadzamy regresję liniową, chcemy oszacować średnią wartość zmiennej odpowiedzi na podstawie wartości zmiennej objaśniającej. Zamiast tego moglibyśmy oszacować medianę, czyli percentyl 0,25, percentyl 0,90 lub dowolny inny percentyl.
Tutaj właśnie pojawia się regresja kwantylowa . Podobnie do zwykłej regresji liniowej, regresja kwantylowa tworzy równanie regresji, które przewiduje pewną wartość (np. medianę, 0,25 percentyla, 0,90 percentyla itp.) dla zmiennej odpowiedzi w oparciu o wartość zmiennej objaśniającej.
W tym samouczku wyjaśniono, jak przeprowadzić regresję kwantylową w Stata.
Przykład: regresja kwantylowa w Stata
W tym przykładzie użyjemy wbudowanego zbioru danych Stata o nazwie auto . Najpierw dopasujemy model regresji liniowej, wykorzystując wagę jako zmienną predykcyjną i mpg jako zmienną odpowiedzi. To powie nam średni oczekiwany mpg samochodu, w oparciu o jego wagę. Następnie dopasujemy model regresji kwantylowej, aby przewidzieć percentyl 0,90 mpg samochodu na podstawie jego masy.
Krok 1: Załaduj i wyświetl dane.
Aby załadować dane, użyj następującego polecenia:
automatyczne korzystanie z systemu
Użyj następującego polecenia, aby uzyskać podsumowanie zmiennych mpg i wagi:
zsumuj wagę mpg
Krok 2: Wykonaj prostą regresję liniową.
Użyj poniższego polecenia, aby wykonać prostą regresję liniową, używając wagi jako zmiennej objaśniającej i mpg jako zmiennej odpowiedzi:
cofnij wagę do mpg
Z tabeli wyjściowej widzimy, że oszacowane równanie regresji ma postać:
przewidywane mpg = 39,44028 – 0,0060087*(waga)
Możemy użyć tego równania, aby znaleźć szacunkową średnią mpg dla samochodu, biorąc pod uwagę jego masę. Na przykład szacuje się, że samochód ważący 4000 funtów ma 15 405 mpg:
przewidywane mpg = 39,44028 – 0,0060087*(4000) = 15,405
Krok 3: Wykonaj regresję kwantylową.
Następnie przeprowadźmy regresję kwantylową, aby uzyskać szacunkowy 90. percentyl zużycia paliwa przez samochód na podstawie jego masy.
Użyj polecenia qreg z kwantylem (0,90) , aby wykonać regresję kwantylową:
waga qreg mpg, kwantyl (0,90)
Z tabeli wyjściowej widzimy, że oszacowane równanie regresji ma postać:
Przewidywany 90. percentyl mpg = 47,02632 – 0,0072368*(waga)
Możemy użyć tego równania, aby znaleźć oszacowanie mpg dla samochodu w 90. percentylu, biorąc pod uwagę jego masę. Na przykład 90. percentyl mpg dla samochodu ważącego 4000 funtów szacuje się na 18 709:
Przewidywany 90. percentyl mpg = 47,02632 – 0,0072368*(4000) = 18,079
Przypomnijmy, że nasz poprzedni model regresji liniowej powiedział nam, że samochód ważący 4000 funtów miał szacunkowe średnie zużycie paliwa na poziomie 15 405 mpg. Zatem ma sens, że ten model regresji kwantylowej mówi nam, że samochód ważący 4000 funtów musiałby zużywać 18 079 mpg, aby znaleźć się w 90. percentylu wszystkich samochodów przy tej określonej masie.
Wiele regresji kwantylowych jednocześnie w Stata
W Stata możliwe jest również jednoczesne wykonanie wielu regresji kwantylowych. Załóżmy na przykład, że chcemy oszacować jednocześnie 25. percentyl, medianę (na przykład 50. percentyl) i 90. percentyl.
Aby to zrobić, możemy użyć polecenia sqreg z poleceniem q() , aby określić kwantyle do oszacowania:
waga mpg sqreg, q (0,25, 0,50, 0,90)
Korzystając z tego wyniku, możemy skonstruować oszacowane równania regresji dla każdej regresji kwantylowej:
(1) 25. percentyl przewidywany mpg = 35,22414 – 0,0051724*(waga)
(2) Przewidywany 50. percentyl mpg = 36,94667 – 0,0053333*(waga)
(3) Przewidywany 90. percentyl mpg = 47,02632 – 0,0072368*(waga)
Dodatkowe zasoby
Jak wykonać prostą regresję liniową w Stata
Jak wykonać wielokrotną regresję liniową w Stata
Jak wykonać regresję kwadratową w Stata