Asymmetrie (statistik)
In diesem Artikel wird erläutert, was Schiefe in der Statistik bedeutet. So finden Sie die Definition von Asymmetrie in der Statistik, welche verschiedenen Arten von Asymmetrie es gibt, wie der Asymmetriekoeffizient berechnet und wie er interpretiert wird.
Was ist Asymmetrie in der Statistik?
In der Statistik ist die Schiefe ein Maß, das den Grad der Symmetrie (oder Asymmetrie) einer Verteilung relativ zu ihrem Mittelwert angibt. Einfach ausgedrückt ist die Schiefe ein statistischer Parameter, mit dem der Grad der Symmetrie (oder Asymmetrie) einer Verteilung bestimmt werden kann, ohne dass eine grafische Darstellung erforderlich ist.
Eine schiefe Verteilung ist also eine Verteilung, die links vom Mittelwert eine andere Anzahl von Werten aufweist als rechts davon. Bei einer symmetrischen Verteilung hingegen gibt es links und rechts vom Mittel gleich viele Werte.
Beispielsweise ist die Exponentialverteilung asymmetrisch und die Normalverteilung symmetrisch.
Arten von Asymmetrie
In der Statistik gibt es drei Arten von Asymmetrie :
- Positive Asymmetrie : Die Verteilung weist rechts vom Mittelwert mehr unterschiedliche Werte auf als links davon.
- Symmetrie : Die Verteilung hat links vom Mittelwert die gleiche Anzahl von Werten wie rechts vom Mittelwert.
- Negative Schiefe : Die Verteilung hat links vom Mittelwert mehr unterschiedliche Werte als rechts davon.
Asymmetriekoeffizient
Der Schiefekoeffizient oder Asymmetrieindex ist ein statistischer Koeffizient, der dabei hilft, die Asymmetrie einer Verteilung zu bestimmen. Durch die Berechnung des Asymmetriekoeffizienten können Sie also die Art der Asymmetrie der Verteilung ermitteln, ohne eine grafische Darstellung davon erstellen zu müssen.
Obwohl es verschiedene Formeln zur Berechnung des Asymmetriekoeffizienten gibt und wir sie alle unten sehen werden, erfolgt die Interpretation des Asymmetriekoeffizienten unabhängig von der verwendeten Formel immer wie folgt:
- Wenn der Schiefekoeffizient positiv ist, ist die Verteilung positiv schief .
- Wenn der Schiefekoeffizient Null ist, ist die Verteilung symmetrisch .
- Wenn der Schiefekoeffizient negativ ist, ist die Verteilung negativ schief .
Fishers Asymmetriekoeffizient
Der Schiefekoeffizient nach Fisher entspricht dem dritten Moment um den Mittelwert dividiert durch die Standardabweichung der Stichprobe. Daher lautet die Formel für den Fisher-Asymmetriekoeffizienten :
Entsprechend kann eine der beiden folgenden Formeln zur Berechnung des Fisher-Koeffizienten verwendet werden:
Gold
ist eine mathematische Hoffnung,
das arithmetische Mittel,
die Standardabweichung und
die Gesamtzahl der Daten.
Wenn die Daten hingegen gruppiert sind, können Sie die folgende Formel verwenden:
Wo in diesem Fall
Es ist das Zeichen von Klasse und
die absolute Häufigkeit des Kurses.
Asymmetriekoeffizient nach Pearson
Der Schiefekoeffizient nach Pearson entspricht der Differenz zwischen dem Stichprobenmittelwert und dem Stichprobenmodus dividiert durch seine Standardabweichung (oder Standardabweichung). Die Formel für den Pearson-Asymmetriekoeffizienten lautet daher wie folgt:
Gold
ist der Pearson-Koeffizient,
das arithmetische Mittel,
Mode und
die Standardabweichung.
Beachten Sie, dass der Pearson-Skewness-Koeffizient nur berechnet werden kann, wenn es sich um eine unimodale Verteilung handelt, d. h. wenn die Daten nur einen Modus enthalten.
Einige Autoren verwenden zur Berechnung des Pearson-Skewness-Koeffizienten den Median anstelle des Modus, im Allgemeinen wird jedoch die obige Formel verwendet.
Bowleys Asymmetriekoeffizient
Der Schiefekoeffizient nach Bowley ist gleich der Summe aus dem dritten Quartil plus dem ersten Quartil minus dem Doppelten des Medians dividiert durch die Differenz zwischen dem dritten und dem ersten Quartil. Die Formel für diesen Asymmetriekoeffizienten lautet daher wie folgt:
Gold
Und
Dies sind jeweils das erste und dritte Quartil und
ist der Median der Verteilung.
Denken Sie daran, dass der Median einer Verteilung mit dem zweiten Quartil übereinstimmt.
Wofür wird Asymmetrie in der Statistik verwendet?
Um die Bedeutung der Asymmetrie in der Statistik vollständig zu verstehen, sehen wir uns an, wie dieses Merkmal einer Verteilung berechnet wird.
Die Schiefe wird hauptsächlich verwendet, um die Form einer Wahrscheinlichkeitsverteilung zu ermitteln, da Sie durch die Berechnung des Schiefekoeffizienten wissen können, ob es sich um eine negative asymmetrische, positive asymmetrische oder symmetrische Verteilung handelt, ohne deren grafische Darstellung vornehmen zu müssen.
Darüber hinaus wird die Schiefe zusammen mit der Kurtosis verwendet, um zu bestimmen, ob ein Datensatz einer Normalverteilung angenähert werden kann. Mit anderen Worten: Der Schiefekoeffizient und der Kurtosiskoeffizient werden berechnet, um zu überprüfen, ob eine Datenreihe die Annahmen einer Normalverteilung erfüllt. Wenn dies der Fall ist, erweist sich dies als sehr vorteilhaft, da dadurch viele statistische Theoreme angewendet werden können.