Hoe grubbs 'tester in excel uit te voeren


De Grubbs-test is een statistische test die kan worden gebruikt om de aanwezigheid van een uitbijter in een dataset te identificeren. Om deze test te gebruiken, moet de dataset die u analyseert ongeveer normaal verdeeld zijn en idealiter minimaal zeven waarnemingen bevatten.

Opmerking: Als u denkt dat er meerdere uitbijters in de dataset voorkomen, moet u in plaats daarvan de gegeneraliseerde extreme student gap-test voor uitschieters gebruiken.

Als u denkt dat de maximale waarde in de gegevensset een uitbijter is, wordt de teststatistiek als volgt berekend:

G = ( xmaxx ) / s

Als u denkt dat de minimumwaarde in de gegevensset een uitbijter is, wordt de teststatistiek als volgt berekend:

G = ( x – x min ) / s

En als u niet zeker weet of de maximumwaarde of minimumwaarde van de dataset een uitbijter is en u een tweezijdige test wilt uitvoeren, wordt de teststatistiek als volgt berekend:

G = max|x ix | /S

waarbij x het steekproefgemiddelde is en s de standaarddeviatie van de steekproef.

De kritische waarde van de test wordt als volgt berekend:

G kritisch = (n-1)t kritisch / √[n(n-2 + t 2 kritisch )]

waarbij t kritisch de kritische waarde is van de t-verdeling met n-2 vrijheidsgraden en het significantieniveau α/n is voor een eenzijdige test en α/(2n) voor een tweezijdige test.

Voorbeeld: Grubbs-test in Excel

Bepaal of de waarde 60 al dan niet een uitbijter is in de volgende gegevensset:

Stap 1: Eerst moeten we ervoor zorgen dat de gegevens ongeveer normaal verdeeld zijn. Om dit te doen, kunnen we een histogram maken om te verifiëren dat de verdeling ongeveer klokvormig is. De volgende schermafbeelding laat zien hoe u een histogram in Excel maakt met behulp van de Data Analysis ToolPak :

Uit het histogram kunnen we zien dat de gegevens ongeveer normaal verdeeld zijn. Dit betekent dat wij de Grubbs-test kunnen uitvoeren.

Histogram in Excel

Stap 2: Vervolgens voeren we de Grubbs-test uit om te bepalen of de waarde 60 echt een uitbijter is in de dataset. De onderstaande schermafbeelding toont de formules die u kunt gebruiken om de Grubbs-test uit te voeren:

De teststatistiek, G , in cel D4 is 3,603219 .

De kritische waarde, G critical , in cel D11 is 2,556581 . Omdat de teststatistiek groter is dan de kritische waarde, betekent dit dat de waarde 60 inderdaad een uitbijter is in deze dataset.

Wat te doen als er een uitbijter wordt geïdentificeerd

Als de Grubbs-test een uitbijter in uw dataset identificeert, heeft u verschillende opties:

  • Controleer nogmaals of de waarde geen typefout of gegevensinvoerfout is. Soms zijn waarden die als uitschieters in datasets verschijnen eenvoudigweg typefouten die door een individu zijn gemaakt tijdens het invoeren van gegevens. Ga terug en controleer of de waarde correct is ingevoerd voordat u verdere beslissingen neemt.
  • Wijs een nieuwe waarde toe aan de uitbijter . Als de uitschieter het gevolg blijkt te zijn van een typefout of een fout bij het invoeren van gegevens, kunt u besluiten er een nieuwe waarde aan toe te kennen, zoals het gemiddelde of de mediaan van de dataset.
  • Verwijder de uitschieter. Als de waarde echt een uitschieter is, kunt u ervoor kiezen deze te verwijderen als deze een aanzienlijke impact heeft op uw algehele analyse.

Wat u ook besluit te doen met de uitschieter, zorg ervoor dat u er nota van neemt wanneer u de eindconclusies van uw analyse presenteert.

Einen Kommentar hinzufügen

Deine E-Mail-Adresse wird nicht veröffentlicht. Erforderliche Felder sind mit * markiert