Hoe de standaardafwijking van elk histogram te schatten


Een histogram biedt een handige manier om de verdeling van waarden in een dataset te visualiseren.

De x-as van een histogram geeft groepen gegevenswaarden weer en de y-as vertelt ons hoeveel waarnemingen in een gegevensset zich in elke groep bevinden.

Histogramgemiddelde

Omdat een histogram waarnemingen in vakken plaatst, is het niet mogelijk om de exacte standaardafwijking te berekenen van de gegevensset die door het histogram wordt weergegeven, maar het is wel mogelijk om de standaardafwijking te schatten.

Het volgende voorbeeld laat zien hoe u dit doet.

Gerelateerd: Hoe u het gemiddelde en de mediaan van elk histogram kunt schatten

Hoe de standaardafwijking van een histogram te schatten

Om de standaarddeviatie van een histogram te schatten, moet u eerst het gemiddelde schatten.

Om het gemiddelde te schatten kunnen we de volgende formule gebruiken:

Gemiddeld: Σm i n i / N

Goud:

  • m i : Het midden van de i- de bak
  • n i : De frequentie van de i- de bak
  • N: De totale steekproefomvang

Stel dat we bijvoorbeeld het volgende histogram hebben:

Histogramgemiddelde

Zo schat u de gemiddelde waarde van dit histogram:

Formule voor het middelen van gegroepeerde gegevens

Wij schatten het gemiddelde op 22,89 .

Opmerking: het middelpunt van elke groep kan worden gevonden door het gemiddelde te nemen van de onderste en bovenste waarden van het bereik. Het middelpunt van de eerste groep wordt bijvoorbeeld als volgt berekend: (1+10) / 2 = 5,5.

Nu we een schatting van het gemiddelde hebben, kunnen we de volgende formule gebruiken om de standaardafwijking te schatten:

Standaardafwijking:Σn i (m i -μ) 2 / (N-1)

Goud:

  • n i : De frequentie van de i- de bak
  • m i : Het midden van de i- de bak
  • µ : Het gemiddelde
  • N: De totale steekproefomvang

Zo passen we deze formule toe op onze dataset:

Schat de standaardafwijking van het histogram We schatten de standaardafwijking van de dataset op 9,6377 .

Hoewel het niet gegarandeerd is dat het exact overeenkomt met de standaardafwijking van de dataset (aangezien we de ruwe gegevenswaarden van de dataset niet kennen), vertegenwoordigt het onze beste schatting van de standaardafwijking.

Aanvullende bronnen

In de volgende tutorials wordt uitgelegd hoe u andere veelvoorkomende taken uitvoert die verband houden met gegevens die in groepen zijn gegroepeerd:

Hoe u de variantie van gegroepeerde gegevens kunt vinden
Hoe u de mediaan van gegroepeerde gegevens kunt vinden
Hoe de gegroepeerde gegevensmodus te vinden

Einen Kommentar hinzufügen

Deine E-Mail-Adresse wird nicht veröffentlicht. Erforderliche Felder sind mit * markiert