Schattingsinterval
In dit artikel wordt uitgelegd wat intervalschatting in de statistiek is. U leert ook hoe intervalschatting wordt uitgevoerd en, ten slotte, hoe intervalschatting verschilt van puntschatting.
Wat is intervalschatting?
In de statistiek is intervalschatting een proces waarbij de waarde van een populatieparameter wordt geschat met behulp van een interval. Preciezer gezegd, intervalschatting omvat het berekenen van het interval waarin de parameterwaarde het meest waarschijnlijk wordt gevonden met een bepaald niveau van betrouwbaarheid .
Als we bijvoorbeeld bij een intervalschatting tot de conclusie komen dat het betrouwbaarheidsinterval voor het populatiegemiddelde (3,7) is met een betrouwbaarheidsniveau van 95%, betekent dit dat het gemiddelde van de onderzochte populatie tussen 3 en 7 zal liggen met een waarschijnlijkheid van 95%.
Over het algemeen is de omvang van een populatie te groot om alle individuen te bestuderen, dus de waarde van de statistische metingen kan niet met zekerheid bekend zijn, maar eerder een benadering.
Intervalschatting wordt dus gebruikt om, op basis van steekproefgegevens, een benadering te geven van het bereik van waarden waartussen de populatieparameter ligt. Op deze manier kan de waarde van de populatieparameter worden geschat op basis van de gegevens die uit een steekproef zijn bestudeerd.
Ten slotte moet u, om de betekenis van intervalschatting volledig te begrijpen, duidelijk zijn over het concept van betrouwbaarheidsinterval. Een betrouwbaarheidsinterval is het interval dat, met een foutmarge, een benadering geeft van de waarden waartussen de waarde van een populatieparameter ligt. Daarom is het betrouwbaarheidsinterval het resultaat dat wordt verkregen uit een intervalschatting.
Formules voor intervalschatting
Hieronder vindt u de verschillende formules voor het schatten van de betrouwbaarheidsintervallen, want afhankelijk van of u het betrouwbaarheidsinterval voor het gemiddelde, voor de variantie of voor de proportie wilt schatten, is de te gebruiken formule verschillend.
Betrouwbaarheidsinterval voor het gemiddelde
Ervan uitgaande dat het proces voor het invoeren van een variabele als volgt gaat:
Het betrouwbaarheidsinterval voor het gemiddelde wordt berekend door het optellen en aftrekken van het steekproefgemiddelde van de waarde van Z α/2 vermenigvuldigd met de standaarddeviatie (σ) en gedeeld door de vierkantswortel van de omvang van de steekproef (n). Daarom is de formule voor het berekenen van het betrouwbaarheidsinterval van het gemiddelde:
Voor grote steekproeven en een betrouwbaarheidsniveau van 95% is de kritische waarde Z α/2 = 1,96 en voor een betrouwbaarheidsniveau van 99% is de kritische waarde Z α/2 = 2,576.
De bovenstaande formule wordt gebruikt als de populatievariantie bekend is. Als de populatievariantie echter onbekend is, wat het meest voorkomende geval is, wordt het betrouwbaarheidsinterval voor het gemiddelde berekend met behulp van de volgende formule:
Goud:
-
is het steekproefgemiddelde.
-
is de waarde van de Student’s t-verdeling van n-1 vrijheidsgraden met een waarschijnlijkheid van α/2.
-
is de standaardafwijking van het monster.
-
is de steekproefomvang.
Betrouwbaarheidsinterval voor variantie
Om het betrouwbaarheidsinterval voor de variantie van een populatie te berekenen, wordt de chikwadraatverdeling gebruikt. Meer specifiek is de formule voor het berekenen van het betrouwbaarheidsinterval voor de variantie :
Goud:
-
is de steekproefomvang.
-
is de standaardafwijking van het monster.
-
is de waarde van de Chi-kwadraatverdeling met n-1 vrijheidsgraden voor een waarschijnlijkheid kleiner dan α/2.
-
is de waarde van de Chi-kwadraatverdeling met n-1 vrijheidsgraden voor een waarschijnlijkheid groter dan 1-α/2.
Betrouwbaarheidsinterval voor proportie
Het betrouwbaarheidsinterval voor het aandeel wordt berekend door het optellen en aftrekken van het steekproefaandeel van de waarde van Z α/2 vermenigvuldigd met de vierkantswortel van het steekproefaandeel (p), vermenigvuldigd met 1-p en gedeeld door de steekproefomvang (n). Daarom is de formule voor het berekenen van het betrouwbaarheidsinterval voor het aandeel :
Goud:
-
is de steekproefaandeel.
-
is de steekproefomvang.
-
is het kwantiel van de standaardnormale verdeling dat overeenkomt met een waarschijnlijkheid van α/2. Voor grote steekproeven en een betrouwbaarheidsniveau van 95% ligt dit gewoonlijk dicht bij 1,96 en voor een betrouwbaarheidsniveau van 99% ligt het gewoonlijk dicht bij 2,576.
Intervalschatting en puntschatting
Ten slotte zullen we zien wat de verschillen zijn tussen intervalschatting en puntschatting, aangezien de waarde van een populatieparameter kan worden geschat met behulp van een interval (zoals we in het hele artikel hebben gezien) of door middel van een puntwaarde.
Het verschil tussen intervalschatting en puntschatting is het bereik van waarden dat wordt gebruikt bij de parameterschatting. Bij intervalschatting wordt een parameter benaderd tot een betrouwbaarheidsinterval, terwijl bij puntschatting de parameter wordt benaderd tot een specifieke waarde.
Daarom wordt bij puntschatting een enkele waarde, berekend op basis van de steekproefgegevens, beschouwd als een benadering van de waarde van de populatieparameter. Het populatiegemiddelde kan bijvoorbeeld nauwkeurig worden geschat met behulp van het steekproefgemiddelde.
Puntschatting heeft dus voor- en nadelen ten opzichte van intervalschatting, zodat elk type schatting geschikt is voor gebruik in een bepaalde situatie. Wilt u meer weten, klik dan op de volgende link: