Hoe het betrouwbaarheidsinterval voor de regressiehelling te berekenen


Eenvoudige lineaire regressie wordt gebruikt om de relatie tussen een voorspellende variabele en een responsvariabele te kwantificeren.

Deze methode vindt een rij die het beste overeenkomt met een set gegevens en heeft de volgende vorm:

ŷ = b0 + b1 x

Goud:

  • ŷ : De geschatte responswaarde
  • b 0 : De oorsprong van de regressielijn
  • b 1 : De helling van de regressielijn
  • x : De waarde van de voorspellende variabele

We zijn vaak geïnteresseerd in de waarde van b 1 , die ons de gemiddelde verandering in deresponsvariabele vertelt die gepaard gaat met een toename van één eenheid in de voorspellende variabele.

We kunnen de volgende formule gebruiken om een betrouwbaarheidsinterval te berekenen voor de waarde van β 1 , de hellingswaarde voor de totale populatie:

Betrouwbaarheidsinterval voor β 1 : b 1 ± t 1-α/2, n-2 * se(b 1 )

Goud:

  •   b 1 = Hellingscoëfficiënt weergegeven in de regressietabel
  • t 1-∝/2, n-2 = De kritische t-waarde voor het 1-∝ betrouwbaarheidsniveau met n-2 vrijheidsgraden waarbij n het totale aantal waarnemingen in onze dataset is
  • se(b 1 ) = De standaardfout van b 1 weergegeven in de regressietabel

Het volgende voorbeeld laat zien hoe u in de praktijk een betrouwbaarheidsinterval voor een regressiehelling kunt berekenen.

Voorbeeld: betrouwbaarheidsinterval voor regressiehelling

Stel dat we een eenvoudig lineair regressiemodel willen toepassen met bestudeerde uren als voorspellende variabele en examenscores als responsvariabele voor 15 leerlingen in een bepaalde klas:

We kunnen een eenvoudige lineaire regressie uitvoeren in Excel en het volgende resultaat verkrijgen:

Met behulp van de coëfficiëntschattingen in het resultaat kunnen we het gepaste eenvoudige lineaire regressiemodel als volgt schrijven:

Score = 65.334 + 1.982*(Uren bestudeerd)

De waarde van de regressiehelling is 1,982 .

Dit vertelt ons dat elk extra uur studietijd gepaard gaat met een gemiddelde stijging van 1.982 in de examenscore.

We kunnen de volgende formule gebruiken om een betrouwbaarheidsinterval van 95% voor de helling te berekenen:

  • 95% BI voor β 1 : b 1 ± t 1-α/2, n-2 * se(b 1 )
  • 95% BI voor β 1 : 1,982 ± t 0,975, 15-2 * 0,248
  • 95% BI voor β 1 : 1,982 ± 2,1604 * 0,248
  • 95% BI voor β 1 : [1,446, 2,518]

Het 95% betrouwbaarheidsinterval voor de regressiehelling is [1,446, 2,518] .

Omdat dit betrouwbaarheidsinterval niet de waarde 0 bevat, kunnen we concluderen dat er een statistisch significant verband bestaat tussen het aantal gestudeerde uren en het examencijfer.

Opmerking : We hebben de inverse t-verdelingscalculator gebruikt om de kritische t-waarde te vinden die overeenkomt met een betrouwbaarheidsniveau van 95% met 13 vrijheidsgraden.

Aanvullende bronnen

De volgende zelfstudies bieden aanvullende informatie over lineaire regressie:

Inleiding tot eenvoudige lineaire regressie
Inleiding tot meervoudige lineaire regressie
Een regressietabel lezen en interpreteren
Hoe regressieresultaten te rapporteren

Einen Kommentar hinzufügen

Deine E-Mail-Adresse wird nicht veröffentlicht. Erforderliche Felder sind mit * markiert