Niet-parametrische statistieken

In dit artikel leggen we uit wat niet-parametrische statistieken zijn en waarvoor ze worden gebruikt. U zult ook een voorbeeld kunnen zien van de toepassing van niet-parametrische statistiek en bovendien wat het verschil is tussen niet-parametrische statistiek en parametrische statistiek.

Wat zijn niet-parametrische statistieken?

Niet-parametrische statistiek is de tak van de inferentiële statistiek die variabelen bestudeert die niet in een waarschijnlijkheidsverdeling passen of waarvan de parameters van de verdeling niet zijn gedefinieerd. Dat wil zeggen dat niet-parametrische statistieken worden gebruikt voor variabelen die niet met theoretische modellen kunnen worden gedefinieerd.

De verdelingen die in niet-parametrische statistieken worden gebruikt, kunnen dus niet a priori worden gedefinieerd, maar de waargenomen gegevens bepalen deze.

Niet-parametrische statistische methoden worden over het algemeen gebruikt wanneer niet aan de eerdere aannames van bepaalde tests wordt voldaan, omdat parametrische statistieken doorgaans vereisen dat bepaalde aannames worden gedaan. Hieronder zullen we zien wat de verschillen zijn tussen niet-parametrische statistieken en parametrische statistieken.

Daarom worden niet-parametrische statistieken gebruikt om populaties te bestuderen die een beoordeling hebben, zoals filmrecensies die één tot vijf sterren krijgen. Een andere toepassing van niet-parametrische statistieken is wanneer gegevens een rangorde hebben maar geen duidelijke numerieke interpretatie, zoals bij het beoordelen van voorkeuren.

Voorbeeld van niet-parametrische statistieken

Zodra we de definitie van niet-parametrische statistiek hebben gezien, zullen we een voorbeeld zien van de toepassing ervan om het concept volledig te begrijpen.

Stel je voor dat we een statistische steekproef hebben die bestaat uit 99 waarnemingen en we willen de waarschijnlijkheid bepalen van de waarde van de volgende waarneming (waarnemingsnummer 100).

Als we parametrische statistieken zouden gebruiken, zouden we eerst verschillende statistische parameters van de steekproef berekenen om de kenmerken ervan te kennen. We zouden dan verschillende statistische tests kunnen uitvoeren met behulp van de berekende parameters om de waarschijnlijkheid van de waarde van de volgende waarneming te bepalen.

Dankzij niet-parametrische statistieken kunnen we echter informatie over de volgende waarde kennen zonder de statistische parameters van de steekproef te hoeven berekenen.

Als we bijvoorbeeld een steekproef van 99 waarnemingen hebben, kunnen we met niet-parametrische statistieken vaststellen dat er een kans van 1% is dat waarnemingsnummer 100 groter is dan alle voorgaande. Op deze manier kan een niet-parametrische schatting van het maximum van een monster worden uitgevoerd.

Kortom, met niet-parametrische statistieken kunnen we kansen berekenen en schattingen maken zonder dat we de statistische parameters van de steekproef hoeven te kennen.

Niet-parametrische statistische tests

Niet-parametrische tests zijn statistische methoden gebaseerd op niet-parametrische statistieken. Daarom worden bij niet-parametrische tests variabelen geëvalueerd zonder aannames te doen over waarschijnlijkheidsverdelingen.

De bekendste niet-parametrische tests zijn de volgende:

  • chikwadraattoets
  • binomiale test
  • Wilcoxon ondertekende rangtest
  • gemiddelde test
  • Anderson-Darling-test
  • Cochran-test
  • Cohen’s Kappa-test
  • Fisher-test
  • Friedman-test
  • Kendall-test
  • Kolmogorov-Smirnov-test
  • Kuiperproef
  • Mann-Whitney-test of Wilcoxon-test
  • McNemar-test
  • Siegel-Tukey-test
  • Tekentest
  • Wald-Wolfowitz-test

Voor- en nadelen van niet-parametrische statistieken

Vergeleken met parametrische statistieken zijn de voor- en nadelen van niet-parametrische statistieken als volgt:

Voordeel:

  • Niet-parametrische statistieken kunnen worden toegepast op numerieke en niet-numerieke gegevens.
  • Over het algemeen hoeven niet-parametrische tests niet noodzakelijkerwijs aan eerdere aannames te voldoen, waardoor ze in meer situaties kunnen worden gebruikt.
  • Wanneer de steekproefomvang klein is, zijn niet-parametrische tests over het algemeen sneller toe te passen.

Nadelen:

  • Soms kan informatie verloren gaan als gegevens worden omgezet in kwalitatieve informatie.
  • Wanneer de steekproefomvang groot is, is het uitvoeren van een niet-parametrische test erg bewerkelijk.
  • Niet-parametrische tests hebben over het algemeen een lagere power, wat betekent dat er een grotere steekproefomvang nodig is om conclusies te trekken met hetzelfde niveau van vertrouwen.

Niet-parametrische statistieken en parametrische statistieken

Laten we tot slot, samenvattend, kijken wat het verschil is tussen niet-parametrische statistieken en parametrische statistieken.

Parametrische statistiek is de tak van de inferentiële statistiek die ervan uitgaat dat gegevens kunnen worden gemodelleerd door een waarschijnlijkheidsverdeling. De Student’s t-toets is bijvoorbeeld een parametrische toets omdat deze de Student’s t-kansverdeling gebruikt.

Het verschil tussen niet-parametrische statistieken en parametrische statistieken is of ze al dan niet gebaseerd zijn op theoretische modellen. Niet-parametrische statistiek bestudeert variabelen die niet passen in waarschijnlijkheidsverdelingen, terwijl parametrische statistiek gedefinieerde waarschijnlijkheidsverdelingen gebruikt.

Einen Kommentar hinzufügen

Deine E-Mail-Adresse wird nicht veröffentlicht. Erforderliche Felder sind mit * markiert