Hoe kwantielregressie uit te voeren in stata
Lineaire regressie is een methode die we kunnen gebruiken om de relatie tussen een of meer verklarende variabelen en een responsvariabele te begrijpen.
Wanneer we lineaire regressie uitvoeren, willen we doorgaans de gemiddelde waarde van de responsvariabele schatten op basis van de waarde van de verklarende variabele. Maar in plaats daarvan zouden we de mediaan kunnen schatten, of het 0,25 percentiel, of het 0,90 percentiel, of welk ander percentiel we maar willen.
Dit is waar kwantielregressie in beeld komt. Net als bij gewone lineaire regressie creëert kwantielregressie een regressievergelijking die een bepaalde waarde voorspelt (bijvoorbeeld mediaan, 0,25 percentiel, 0,90 percentiel, enz.) voor een responsvariabele op basis van de waarde van de verklarende variabele.
In deze zelfstudie wordt uitgelegd hoe u kwantielregressie uitvoert in Stata.
Voorbeeld: kwantielregressie in Stata
Voor dit voorbeeld gebruiken we de ingebouwde Stata-gegevensset genaamd auto . We zullen eerst een lineair regressiemodel passen met gewicht als voorspellende variabele en mpg als responsvariabele. Dit zal ons het gemiddelde verwachte mpg van een auto vertellen, gebaseerd op zijn gewicht. Vervolgens passen we een kwantielregressiemodel toe om het percentiel van 0,90 mpg van een auto te voorspellen, op basis van zijn gewicht.
Stap 1: Gegevens laden en weergeven.
Gebruik de volgende opdracht om de gegevens te laden:
automatisch gebruik van het systeem
Gebruik de volgende opdracht om een samenvatting te krijgen van de mpg- en gewichtsvariabelen:
som het mpg-gewicht op
Stap 2: Voer een eenvoudige lineaire regressie uit.
Gebruik de volgende opdracht om een eenvoudige lineaire regressie uit te voeren, waarbij u gewicht als verklarende variabele en mpg als responsvariabele gebruikt:
gewicht terugbrengen naar mpg
Uit de uitvoertabel kunnen we zien dat de geschatte regressievergelijking is:
voorspelde mpg = 39,44028 – 0,0060087*(gewicht)
We kunnen deze vergelijking gebruiken om het geschatte gemiddelde mpg voor een auto te vinden, gegeven zijn gewicht. Een auto die 4.000 pond weegt, heeft bijvoorbeeld naar schatting een mpg van 15.405:
voorspelde mpg = 39,44028 – 0,0060087*(4000) = 15,405
Stap 3: Voer kwantielregressie uit.
Laten we vervolgens een kwantielregressie uitvoeren om het geschatte 90e percentiel van het brandstofverbruik van een auto te verkrijgen, gebaseerd op zijn gewicht.
Gebruik de opdracht qreg met quantile(0.90) om deze kwantielregressie uit te voeren:
gewicht qreg mpg, kwantiel (0,90)
Uit de uitvoertabel kunnen we zien dat de geschatte regressievergelijking is:
90e percentiel voorspelde mpg = 47,02632 – 0,0072368*(gewicht)
We kunnen deze vergelijking gebruiken om de schatting te vinden mpg voor een auto in het 90e percentiel, gezien het gewicht. Het 90e percentiel mpg voor een auto met een gewicht van 4.000 pond wordt bijvoorbeeld geschat op 18.709:
90e percentiel voorspelde mpg = 47,02632 – 0,0072368*(4.000) = 18,079
Bedenk dat ons vorige lineaire regressiemodel ons vertelde dat een auto van 4.000 pond een geschat gemiddeld brandstofverbruik had van 15.405 mpg. Het is dus logisch dat dit kwantielregressiemodel ons vertelt dat een auto van 4.000 pond 18.079 mpg zou moeten halen om in het 90e percentiel van alle auto’s met dat specifieke gewicht te komen.
Meerdere kwantielregressies tegelijk in Stata
Het is ook mogelijk om meerdere kwantielregressies tegelijk uit te voeren in Stata. Stel dat we bijvoorbeeld het 25e percentiel, de mediaan (bijvoorbeeld het 50e percentiel) en het 90e percentiel tegelijkertijd willen schatten.
Om dit te doen, kunnen we de opdracht sqreg gebruiken met de opdracht q() om de te schatten kwantielen te specificeren:
gewicht mpg sqreg, q (0,25, 0,50, 0,90)
Met behulp van dit resultaat kunnen we de geschatte regressievergelijkingen voor elke kwantielregressie construeren:
(1) 25e percentiel voorspelde mpg = 35,22414 – 0,0051724*(gewicht)
(2) 50e percentiel voorspelde mpg = 36,94667 – 0,0053333*(gewicht)
(3) 90e percentiel voorspelde mpg = 47,02632 – 0,0072368*(gewicht)
Aanvullende bronnen
Hoe eenvoudige lineaire regressie uit te voeren in Stata
Hoe meervoudige lineaire regressie uit te voeren in Stata
Hoe kwadratische regressie uit te voeren in Stata