Parameterschatting

In dit artikel wordt uitgelegd wat parameterschatting in de statistiek is. Zo ontdek je hoe een parameter wordt geschat in de statistiek, de verschillende soorten schattingen en voorbeelden van parameterschattingen.

Wat is parameterschatting?

Parameterschatting is een statistische methode voor het schatten van de waarde van een populatieparameter uit een steekproef. Dat wil zeggen dat in de statistiek parameterschatting wordt gebruikt om een populatieparameter te benaderen door berekeningen uit te voeren met gegevensmonsters.

Over het algemeen zijn de parameters van een populatie niet bekend en is deze over het algemeen te groot om alle individuen te bestuderen. Er wordt dus een steekproef uit de populatie genomen, deze steekproef wordt statistisch geanalyseerd en ten slotte worden de verkregen resultaten afgeleid van de gehele populatie. Door de schatting van statistische parameters kunnen we dus een benaderend idee krijgen van de waarden van de populatieparameters.

Bij het schatten van een parameter is er altijd een foutmarge. Omdat de werkelijke waarde van de populatieparameter gewoonlijk onbekend is, wordt bij het schatten van een parameter een benadering gemaakt en daarom kan er een discrepantie optreden tussen de werkelijke waarde en de geschatte waarde.

Soorten parameterschattingen

In de statistiek zijn er twee soorten parameterschattingen :

  • Specifieke parameterschatting : omvat het schatten van de waarde van de populatieparameter op een specifieke waarde. Normaal gesproken wordt de monsterparameterwaarde gebruikt als een schatting van de populatieparameter.
  • Schatting van parameters met intervallen : het is gebaseerd op de schatting van de populatieparameter met een interval. Dus in plaats van de populatieparameter te benaderen tot een enkele waarde, benadert deze een reeks waarden.

Puntschatting is nauwkeuriger dan intervalschatting, omdat de benadering wordt teruggebracht tot één enkele waarde. Intervalschatting is echter betrouwbaarder omdat het waarschijnlijker is dat de werkelijke waarde van de parameter binnen een interval ligt dan het bepalen van de exacte waarde met behulp van een puntschatting.

Puntschatting

Puntschatting omvat het schatten van de exacte waarde van een populatieparameter op basis van steekproefgegevens. Dat wil zeggen dat de puntschatting een specifieke waarde van een populatieparameter oplevert, waarbij de steekproefwaarde van de parameter als referentie wordt gebruikt.

Om bijvoorbeeld het gemiddelde van een populatie van 1.000 individuen te bepalen, kunnen we een puntschatting maken en de waarde van het gemiddelde van een steekproef van 50 mensen berekenen. We kunnen daarom de waarde van het steekproefgemiddelde nemen als een puntschatting van het populatiegemiddelde.

Een schatter is dus een steekproefstatistiek die wordt gebruikt om de waarde van een populatieparameter te schatten. De waarde van de steekproefparameter wordt dus beschouwd als een schatting van de waarde van de populatieparameter.

Schattingsinterval

Intervalschatting omvat het schatten van de waarde van een populatieparameter met behulp van een interval. Preciezer gezegd, intervalschatting omvat het berekenen van het interval waarin de parameterwaarde het meest waarschijnlijk zal vallen met een bepaald niveau van betrouwbaarheid.

Als we bijvoorbeeld bij een intervalschatting concluderen dat het betrouwbaarheidsinterval voor het populatiegemiddelde (3,7) is met een betrouwbaarheidsniveau van 95%, betekent dit dat het gemiddelde van de bestudeerde populatie tussen 3 en 7 zal liggen met een waarschijnlijkheid van 95. %.

Het interval dat de intervalschatting oplevert, wordt het betrouwbaarheidsinterval genoemd. Het betrouwbaarheidsinterval is dus een interval dat, met een foutmarge, een schatting geeft van de waarden waartussen de waarde van een populatieparameter ligt. Kort gezegd is het betrouwbaarheidsinterval het resultaat dat wordt verkregen uit een intervalschatting. Om het betrouwbaarheidsinterval van een intervalschatting te berekenen, moet de bijbehorende formule worden toegepast:

Voorbeeld van het schatten van een parameter

Zodra we de definitie van parameterschatting hebben gezien en wat de verschillende soorten parameterschattingen zijn, zullen we een voorbeeld zien van hoe een populatieparameter kan worden geschat.

  • In marktonderzoek willen we de gemiddelde prijs van koptelefoons bepalen. Er zijn echter zoveel modellen dat het niet mogelijk is om de prijs van allemaal te bestuderen, daarom wordt besloten een steekproef te nemen van de vijf merken die vorig jaar de meeste koptelefoons verkochten (de gegevens worden hieronder weergegeven). Schatting van de gemiddelde prijs van de bevolking, af en toe en met tussenpozen.

25 8 14 19 12

Om het populatiegemiddelde nauwkeurig te schatten, berekent u eenvoudigweg het gemiddelde van de steekproefgegevens. We passen dus de rekenkundige formule toe:

\overline{x}=\cfrac{25+8+14+19+12}{5}=15,6

We zullen echter schattingen maken met intervallen met een betrouwbaarheidsniveau van 95%, aangezien dit het meest gebruikelijke betrouwbaarheidsniveau is. Om een intervalschatting uit te voeren is het dus noodzakelijk om de formule voor het betrouwbaarheidsinterval voor het gemiddelde toe te passen:

(7,43 \ , \ 23,77 )

Schattingsfout

In de praktijk is het erg lastig om een exacte schatting te maken van de werkelijke waarde van een parameter. Daarom zit er vaak een fout in de schatting. Logischerwijs moeten we proberen de schattingsfout te minimaliseren.

Als we dus de waarde van de populatieparameter kennen, kunnen we de schattingsfout berekenen, die wordt gedefinieerd als het verschil tussen de geschatte waarde en de werkelijke waarde van de parameter.

e=\widehat{\theta}-\theta

Goud

\widehat{\theta}

is de waarde van de schatting en

\theta

is de werkelijke waarde van de parameter.

U kunt ook de gemiddelde kwadratische fout (MSE) berekenen, wat het gemiddelde is van de kwadratische fouten. Opgemerkt moet worden dat de gemiddelde kwadratische fout de variantie van de schatter vertegenwoordigt.

\displaystyle ECM=\cfrac{1}{n}\sum_{i=1}^n \left(\widehat{\theta}-\theta \right)^2

Wanneer de werkelijke waarde van de populatieparameter niet bekend is, wat het meest voorkomende geval is, wordt gewoonlijk een hypothesetest uitgevoerd om te controleren of de schatting correct is.

Einen Kommentar hinzufügen

Deine E-Mail-Adresse wird nicht veröffentlicht. Erforderliche Felder sind mit * markiert