Bereik versus standaardafwijking: wanneer moet u ze gebruiken?


Bereik en standaardafwijking zijn twee manieren om de verdeling van waarden in een dataset te meten.

Het bereik vertegenwoordigt het verschil tussen de minimumwaarde en de maximumwaarde in een gegevensset.

De standaardafwijking meet de typische afwijking van individuele waarden van de gemiddelde waarde. Het wordt als volgt berekend:

s = √(Σ(x ikX ) 2 / (n-1))

Goud:

  • Σ: Een symbool dat “som” betekent
  • x i : De waarde van de i- de waarneming in de steekproef
  • x : De steekproefgemiddelden
  • n: De steekproefomvang

Stel dat we bijvoorbeeld de volgende gegevensset hebben:

Gegevensset: 1, 4, 8, 11, 13, 17, 19, 19, 20, 23, 24, 24, 25, 28, 29, 31, 32

Het bereik wordt berekend als: 31 -1 = 32.

We kunnen een rekenmachine gebruiken om uit te vinden dat de standaardafwijking 9,25 is.

Bereik en standaarddeviatie: overeenkomsten en verschillen

Bereik en standaardafwijking hebben de volgende gelijkenis:

  • Beide statistieken meten de verdeling van waarden in een dataset.

Het bereik en de standaardafwijking hebben echter het volgende verschil:

  • Het bereik vertelt ons het verschil tussen de grootste en de kleinste waarde in de dataset.
  • De standaardafwijking vertelt ons de typische afwijking van individuele waarden van de gemiddelde waarde van de dataset.

Bereik versus Standaardafwijking: wanneer moet u ze gebruiken?

We moeten bereik gebruiken als we het verschil tussen de grootste en kleinste waarden in een dataset willen begrijpen.

Stel bijvoorbeeld dat een professor een examen aflegt aan 100 studenten. Ze kan de schaal gebruiken om het verschil te begrijpen tussen de hoogste en laagste score die alle leerlingen in de klas behalen.

Omgekeerd moeten we de standaarddeviatie gebruiken als we willen begrijpen in hoeverre de typische waarde van een dataset afwijkt van de gemiddelde waarde.

Als een professor bijvoorbeeld een examen aan 100 studenten afneemt, kan hij of zij de standaarddeviatie gebruiken om te kwantificeren hoeveel de typische examenscore afwijkt van de gemiddelde examenscore.

Het is vermeldenswaard dat we niet hoeven te kiezen tussen het gebruik van bereik of standaarddeviatie om de verdeling van waarden in een dataset te beschrijven. We kunnen beide statistieken gebruiken omdat ze ons totaal verschillende informatie verschaffen.

De nadelen van bereik en standaarddeviatie

Zowel het bereik als de standaarddeviatie hebben een nadeel: ze worden beide beïnvloed door uitbijters .

Om dit te illustreren, bekijken we de volgende dataset:

Gegevensset: 1, 4, 8, 11, 13, 17, 19, 19, 20, 23, 24, 24, 25, 28, 29, 31, 32

We kunnen de volgende waarden berekenen voor het bereik en de standaardafwijking van deze dataset:

  • Bereik: 31
  • Standaardafwijking: 9,25

Bedenk echter of de dataset een extreme uitbijter had:

Gegevensset: 1, 4, 8, 11, 13, 17, 19, 19, 20, 23, 24, 24, 25, 28, 29, 31, 32, 378

We kunnen een rekenmachine gebruiken om de volgende statistieken voor deze dataset te vinden:

  • Bereik: 377
  • Standaardafwijking: 85,02

Merk op hoe het bereik en de standaardafwijking aanzienlijk veranderen als gevolg van een uitbijter.

Hoewel bereik en standaardafwijking nuttige maatstaven kunnen zijn om een idee te krijgen van de verdeling van waarden in een dataset, moet je er eerst voor zorgen dat de dataset geen uitschieters bevat die deze waarden beïnvloeden. maatregelen. Anders kunnen het bereik en de standaardafwijking misleidend zijn.

Einen Kommentar hinzufügen

Deine E-Mail-Adresse wird nicht veröffentlicht. Erforderliche Felder sind mit * markiert