Wat wordt verklaard door variantie? (definitie & #038; voorbeeld)


Verklaarde variantie (ook wel „verklaarde variatie“ genoemd) verwijst naar de variantie van de responsvariabele in een model die kan worden verklaard door de voorspellende variabele(n) van het model.

Hoe hoger de verklaarde variantie van een model, hoe meer variatie in de gegevens die het model kan verklaren.

De verklaarde variantie komt voor in de resultaten van twee verschillende statistische modellen:

1. ANOVA: gebruikt om de gemiddelden van drie of meer onafhankelijke groepen te vergelijken.

2. Regressie: gebruikt om de relatie tussen een of meer voorspellende variabelen en een responsvariabele te kwantificeren.

De volgende voorbeelden laten zien hoe u de resterende variantie in elk van deze methoden kunt interpreteren.

Opmerking : het tegenovergestelde van de verklaarde variantie wordt residuele variantie genoemd.

Variantie uitgelegd in ANOVA-modellen

Elke keer dat we een ANOVA-model (“variantieanalyse”) passen, krijgen we een ANOVA-tabel die er als volgt uitziet:

De verklaarde variantie is te vinden in de SS-kolom (“som van de kwadraten”) voor variatie tussen groepen .

In het bovenstaande ANOVA-model zien we dat de verklaarde variantie 192,2 is.

Om te bepalen of deze verklaarde variantie „hoog“ is, kunnen we de gemiddelde som van de kwadraten voor binnen groepen en de gemiddelde som van de kwadraten voor tussen groepen berekenen en de verhouding tussen de twee vinden, die de totale F-waarde in de ANOVA-tabel oplevert.

  • F = MS komt binnen / MS komt binnen
  • F = 96,1 / 40,76296
  • F = 2,357

De F-waarde in de bovenstaande ANOVA-tabel is 2,357 en de overeenkomstige p-waarde is 0,113848.

Omdat deze p-waarde niet kleiner is dan α = 0,05, hebben we niet voldoende bewijs om de nulhypothese van ANOVA te verwerpen.

Dit betekent dat we niet voldoende bewijs hebben om te zeggen dat het gemiddelde verschil tussen de groepen die we vergelijken significant verschillend is.

Dit vertelt ons dat de verklaarde variantie in het ANOVA-model klein is vergeleken met de onverklaarde variantie.

Variantie uitgelegd in regressiemodellen

In een regressiemodel wordt de verklaarde variantie samengevat als R-kwadraat , vaak geschreven als R2 .

Deze waarde vertegenwoordigt het deel van de variantie in de responsvariabele dat kan worden verklaard door de voorspellende variabele(n) in het model.

De waarde van R kwadraat kan variëren van 0 tot waarbij:

  • Een waarde van 0 geeft aan dat de responsvariabele helemaal niet kan worden verklaard door de voorspellende variabele(n).
  • Een waarde van 1 geeft aan dat de responsvariabele perfect en zonder fouten kan worden verklaard door de voorspellende variabele(n).

Wanneer we een regressiemodel passen, krijgen we meestal een resultaat dat er als volgt uitziet:

We kunnen zien dat de verklaarde variantie 168,5976 is en de totale variantie 174,5 .

Met behulp van deze waarden kunnen we de R-kwadraatwaarde voor dit regressiemodel als volgt berekenen:

  • R kwadraat: Regressie SS / Totaal SS
  • R kwadraat: 168,5976 / 174,5
  • R kwadraat: 0,966

Omdat de R-kwadraatwaarde van dit model dicht bij 1 ligt, vertelt dit ons dat de variantie die in het model wordt uitgelegd extreem hoog is.

Met andere woorden: het model kan de voorspellende variabelen goed gebruiken om de variatie in de responsvariabele te verklaren.

Gerelateerd: Wat is een goede R-kwadraatwaarde?

Einen Kommentar hinzufügen

Deine E-Mail-Adresse wird nicht veröffentlicht. Erforderliche Felder sind mit * markiert