Schatter

In dit artikel wordt uitgelegd wat een schatter in de statistiek is en wat de eigenschappen zijn van een goede schatter. Daarnaast kunt u voorbeelden zien van schatters en de verschillende soorten schattingen die in de statistieken voorkomen.

Wat is een schatter?

In de statistiek is een schatter een statistiek die wordt gebruikt om de waarde van een populatieparameter te schatten. Met andere woorden: een schatter wordt gebruikt om een onbekende parameter van een populatie te schatten.

Het steekproefgemiddelde is bijvoorbeeld een schatter van het populatiegemiddelde. U kunt dus het rekenkundig gemiddelde van een steekproef berekenen en deze waarde gebruiken als benadering van het populatiegemiddelde.

Steekproefschatters zijn heel gebruikelijk in de statistieken, omdat normaal gesproken niet alle elementen van een populatie bekend zijn en daarom de statistische parameters van de populatie niet kunnen worden berekend. Vervolgens wordt een willekeurige steekproef gekozen en worden de statistische metingen van de steekproef bepaald, en vervolgens kunnen, op basis van de gemaakte berekeningen, de populatieparameters worden benaderd.

Kenmerken van een goede schatter

Nadat we de definitie van een schatter hebben gezien, gaan we kijken welke kenmerken een goede schatter moet hebben om het concept beter te begrijpen.

  1. Onbevooroordeeld : een zuivere schatter is een schatter waarvan de steekproefwaarde gelijk is aan de populatiewaarde. Dus hoe groter de vertekening van een schatter, hoe minder nauwkeurig deze zal zijn. Daarom willen we dat de bias van de puntschatter klein is, zodat het verschil tussen de waarde van de puntschatter en de werkelijke waarde zo dicht mogelijk bij nul ligt.
  2. Consistentie : Een consistente schatter is een schatter waarvan de waarde, naarmate de steekproefomvang toeneemt, de werkelijke waarde van de parameter benadert. Dus hoe groter de steekproefomvang, hoe beter de geproduceerde schatting.
  3. Efficiëntie : Hoe kleiner de variantie van de steekproefverdeling van de puntschatter, hoe groter de efficiëntie van de puntschatter. We willen dus dat de puntschatter efficiënt is, zodat de variantie klein is. Als we dus uitsluitend op dit kenmerk vertrouwen, zullen we tussen tweepuntsschatters altijd de schatter met de grootste efficiëntie (of de laagste variantie) kiezen.
  4. Robuustheid : een robuuste schatter is een schatter waarvan, in het geval van wijziging van enkele initiële hypothesen, het resultaat van de schatting niet significant wordt gewijzigd.
  5. Voldoende : Een schatter is voldoende als hij alle relevante informatie over de steekproef in de schatting samenvat, zodat geen enkele andere schatter aanvullende informatie kan geven over de geschatte populatieparameter. Daarom is één schatter voldoende als dit de beste statistiek is die kan worden gekozen om de populatieparameter te benaderen.

Voorbeelden van schatters

Vaak worden de volgende steekproefschatters gebruikt als schattingen van populatieparameters.

  • De puntschatting van een populatiegemiddelde is de waarde van het rekenkundig gemiddelde van de steekproef. Over het algemeen wordt het symbool gebruikt

    \overline{x}

    om de waarde van het steekproefgemiddelde weer te geven, terwijl het symbool voor het populatiegemiddelde de Griekse letter µ is.

\overline{x}=\mu

  • De standaardafwijking (of standaardafwijking) van een populatie kan nauwkeurig worden geschat aan de hand van de standaardafwijkingswaarde van de steekproef. De standaardafwijking van de populatie wordt weergegeven door de Griekse letter σ en de waarde van de standaardafwijking van de steekproef wordt aangegeven door de letter s.

s=\sigma

  • Met de steekproefaandeelwaarde kan het aandeel van een populatie op een specifieke manier worden geschat. Het symbool voor populatieaandeel is de letter py, terwijl het symbool voor steekproefaandeel dat is

    \widehat{p}.

\widehat{p}=p

Schatting en schatting

Zoals in het hele artikel wordt uitgelegd, wordt een schatter gebruikt om een populatieparameter te schatten. Houd er echter rekening mee dat er twee soorten schattingen zijn:

  • Puntschatting : bestaat uit het nemen van de steekproefwaarde van de parameter als een benadering van de populatiewaarde.
  • Intervalschatting : omvat het benaderen van de waarde van de populatieparameter met een interval, in plaats van een specifieke waarde. Daarom wordt bij dit type schatting een interval berekend waarbij de waarschijnlijkheid dat de werkelijke waarde van de parameter binnen het interval ligt zeer hoog is.

Elk type schatting heeft zijn voor- en nadelen en afhankelijk van het geval is het praktischer om een punt- of intervalschatting te gebruiken. Voor meer informatie kunt u naar onze overeenkomstige artikelen zoeken in de zoekmachine van deze site.

Fout van een schatter

In de praktijk is het erg lastig om een exacte schatting te maken van de werkelijke waarde van een parameter. Daarom zit er vaak een fout in de schatting. Logischerwijs moeten we proberen de schattingsfout te minimaliseren.

We definiëren de fout van een schatter dus als het verschil tussen de geschatte waarde en de werkelijke waarde van de parameter.

e=\widehat{\theta}-\theta

Goud

\widehat{\theta}

is de waarde van de schatting en

\theta

is de werkelijke waarde van de parameter.

U kunt ook de gemiddelde kwadratische fout (MSE) berekenen, wat het gemiddelde is van de kwadratische fouten. Opgemerkt moet worden dat de gemiddelde kwadratische fout de variantie van de schatter vertegenwoordigt.

\displaystyle ECM=\cfrac{1}{n}\sum_{i=1}^n \left(\widehat{\theta}-\theta \right)^2

Einen Kommentar hinzufügen

Deine E-Mail-Adresse wird nicht veröffentlicht. Erforderliche Felder sind mit * markiert