Nichtparametrische statistik
In diesem Artikel erklären wir, was nichtparametrische Statistiken sind und wofür sie verwendet werden. Außerdem können Sie sich ein Beispiel für die Anwendung nichtparametrischer Statistiken ansehen und außerdem erfahren, was der Unterschied zwischen nichtparametrischen Statistiken und parametrischen Statistiken ist.
Was sind nichtparametrische Statistiken?
Die nichtparametrische Statistik ist der Zweig der Inferenzstatistik, der Variablen untersucht, die nicht zu einer Wahrscheinlichkeitsverteilung passen oder deren Parameter der Verteilung nicht definiert sind. Das heißt, nichtparametrische Statistiken werden für Variablen verwendet, die nicht mit theoretischen Modellen definiert werden können.
Daher können die in der nichtparametrischen Statistik verwendeten Verteilungen nicht a priori definiert werden, sondern werden durch die beobachteten Daten bestimmt.
Nichtparametrische statistische Methoden werden im Allgemeinen verwendet, wenn die vorherigen Annahmen bestimmter Tests nicht erfüllt sind, da parametrische Statistiken im Allgemeinen bestimmte Annahmen erfordern. Im Folgenden werden wir sehen, was die Unterschiede zwischen nichtparametrischen Statistiken und parametrischen Statistiken sind.
Daher werden nichtparametrische Statistiken verwendet, um Populationen zu untersuchen, die eine Bewertung haben, beispielsweise Filmkritiken, die ein bis fünf Sterne erhalten. Eine weitere Anwendung nichtparametrischer Statistiken besteht darin, dass Daten eine Rangfolge, aber keine eindeutige numerische Interpretation haben, beispielsweise bei der Bewertung von Präferenzen.
Beispiel für nichtparametrische Statistik
Sobald wir die Definition der nichtparametrischen Statistik kennengelernt haben, sehen wir uns ein Beispiel für ihre Anwendung an, um das Konzept vollständig zu verstehen.
Stellen Sie sich vor, wir haben eine statistische Stichprobe bestehend aus 99 Beobachtungen und möchten die Wahrscheinlichkeit des Wertes der nächsten Beobachtung (Beobachtungsnummer 100) bestimmen.
Wenn wir parametrische Statistiken verwenden würden, würden wir zunächst mehrere statistische Parameter der Stichprobe berechnen, um ihre Eigenschaften zu kennen. Mithilfe der berechneten Parameter könnten wir dann verschiedene statistische Tests durchführen, um die Wahrscheinlichkeit des Werts der nächsten Beobachtung zu bestimmen.
Dank der nichtparametrischen Statistik können wir jedoch Informationen über den nächsten Wert erhalten, ohne die statistischen Parameter der Stichprobe berechnen zu müssen.
Wenn wir beispielsweise eine Stichprobe von 99 Beobachtungen haben, können wir mit nichtparametrischen Statistiken feststellen, dass eine Wahrscheinlichkeit von 1 % besteht, dass Beobachtung Nummer 100 größer als alle vorherigen ist. Auf diese Weise kann eine nichtparametrische Schätzung des Maximums einer Stichprobe durchgeführt werden.
Kurz gesagt: Mit nichtparametrischen Statistiken können wir Wahrscheinlichkeiten berechnen und Schätzungen vornehmen, ohne die statistischen Parameter der Stichprobe kennen zu müssen.
Nichtparametrische statistische Tests
Nichtparametrische Tests sind statistische Methoden, die auf nichtparametrischen Statistiken basieren. Daher werden in nichtparametrischen Tests Variablen ausgewertet, ohne Annahmen über Wahrscheinlichkeitsverteilungen zu treffen.
Die bekanntesten nichtparametrischen Tests sind die folgenden:
- Chi-Quadrat-Test
- Binomialtest
- Wilcoxon hat den Rangtest unterzeichnet
- Mediantest
- Anderson-Darling-Test
- Cochran-Test
- Cohens Kappa-Test
- Fisher-Test
- Friedman-Test
- Kendall-Test
- Kolmogorov-Smirnov-Test
- Kuiper-Test
- Mann-Whitney-Test oder Wilcoxon-Test
- McNemar-Test
- Siegel-Tukey-Test
- Zeichentest
- Wald-Wolfowitz-Test
Vor- und Nachteile nichtparametrischer Statistiken
Im Vergleich zur parametrischen Statistik sind die Vor- und Nachteile der nichtparametrischen Statistik wie folgt:
Vorteil:
- Nichtparametrische Statistiken können auf numerische und nicht numerische Daten angewendet werden.
- Im Allgemeinen müssen nichtparametrische Tests nicht unbedingt vorherige Annahmen erfüllen, wodurch sie in mehr Situationen eingesetzt werden können.
- Wenn die Stichprobengröße klein ist, lassen sich nichtparametrische Tests im Allgemeinen schneller anwenden.
Nachteile:
- Manchmal können Informationen verloren gehen, wenn Daten in qualitative Informationen umgewandelt werden.
- Bei großen Stichproben ist die Durchführung eines nichtparametrischen Tests sehr aufwändig.
- Nichtparametrische Tests haben im Allgemeinen eine geringere Trennschärfe, was bedeutet, dass eine größere Stichprobengröße erforderlich ist, um Schlussfolgerungen mit dem gleichen Maß an Sicherheit zu ziehen.
Nichtparametrische Statistiken und parametrische Statistiken
Lassen Sie uns abschließend zusammenfassend sehen, was der Unterschied zwischen nichtparametrischer Statistik und parametrischer Statistik ist.
Parametrische Statistik ist der Zweig der Inferenzstatistik, der davon ausgeht, dass Daten durch eine Wahrscheinlichkeitsverteilung modelliert werden können. Beispielsweise ist der Student-t-Test ein parametrischer Test, da er die Student-t-Wahrscheinlichkeitsverteilung verwendet.
Der Unterschied zwischen nichtparametrischer Statistik und parametrischer Statistik besteht darin, ob sie auf theoretischen Modellen basieren oder nicht. Die nichtparametrische Statistik untersucht Variablen, die nicht zu Wahrscheinlichkeitsverteilungen passen, während die parametrische Statistik definierte Wahrscheinlichkeitsverteilungen verwendet.