Excel: hoe p-waarden in regressie-uitvoer te interpreteren
Meervoudige lineaire regressie wordt gebruikt om de relatie tussen twee of meer voorspellende variabelen en eenresponsvariabele te kwantificeren.
Wanneer we meervoudige lineaire regressie uitvoeren, zijn we altijd geïnteresseerd in de p-waarden in het resultaat om te bepalen of de relatie tussen de voorspellende variabelen en de responsvariabele statistisch significant is.
In deze tutorial wordt uitgelegd hoe u p-waarden interpreteert in de uitvoer van een meervoudig lineair regressiemodel in Excel.
Voorbeeld: P-waarden interpreteren in regressie-uitvoer in Excel
Stel dat we willen weten of het aantal uren dat wordt gestudeerd en het aantal afgelegde voorbereidende examens van invloed zijn op het cijfer dat een student krijgt voor een bepaald toelatingsexamen voor de universiteit.
Om deze relatie te onderzoeken, kunnen we een meervoudige lineaire regressie uitvoeren met behulp van bestudeerde uren en voorbereidende examens als voorspellende variabelen en examenscores als responsvariabele.
De volgende schermafbeelding toont de regressie-uitvoer van dit model in Excel:
Er zijn drie p-waarden waar we in het resultaat naar moeten kijken:
- P-waarde van het totale model
- P-waarde van eerste voorspellende variabele (uren)
- P-waarde van de tweede voorspellende variabele (voorbereidende examens)
Zo interpreteert u elke p-waarde:
P-waarde van het totale model
De p-waarde voor het totale model is te vinden in de kolom F Significantie in het resultaat.
We kunnen zien dat deze p-waarde 0,00 is.
Omdat deze waarde kleiner is dan 0,05 kunnen we concluderen dat het regressiemodel als geheel statistisch significant is.
Met andere woorden: de combinatie van gestudeerde uren en afgelegde voorbereidende examens heeft een statistisch significante relatie met het eindexamencijfer.
P-waarde van eerste voorspellende variabele (uren)
De p-waarde voor de eerste voorspellende variabele, uren, is 0,00.
Omdat deze waarde kleiner is dan 0,05 kunnen we concluderen dat de bestudeerde uren statistisch significant zijn.
Met andere woorden: het aantal uren dat een student studeert heeft een statistisch significante relatie met het eindexamencijfer.
P-waarde van de tweede voorspellende variabele (voorbereidende examens)
De p-waarde voor de tweede voorspellende variabele, voorbereidende examens, is 0,52.
Omdat deze waarde niet minder dan 0,05 bedraagt, kunnen we concluderen dat het aantal afgelegde voorbereidende examens niet statistisch significant is.
Met andere woorden: het aantal voorbereidende examens dat een student aflegt, heeft geen statistisch significante relatie met het cijfer dat op het eindexamen wordt behaald.
Omdat deze variabele statistisch niet significant is, kunnen we besluiten deze uit het model te verwijderen, omdat deze geen significante verbetering oplevert voor het algehele model.
In dit geval zouden we een eenvoudige lineaire regressie kunnen uitvoeren met alleen de bestudeerde uren als voorspellende variabele.
Aanvullende bronnen
In de volgende zelfstudies wordt uitgelegd hoe u andere veelvoorkomende taken in Excel kunt uitvoeren:
Hoe u eenvoudige lineaire regressie uitvoert in Excel
Hoe u meerdere lineaire regressies uitvoert in Excel
Hoe polynomiale regressie uit te voeren in Excel