Formmessungen

In diesem Artikel wird erklärt, was Formmaße sind. Sie erfahren also, wofür Formmetriken verwendet werden, wie Formmetriken interpretiert werden und wie diese Art von statistischen Metriken berechnet wird.

Was sind Formmaße?

In der Statistik sind Formmaße Indikatoren, die es uns ermöglichen, eine Wahrscheinlichkeitsverteilung anhand ihrer Form zu beschreiben. Das heißt, Formmaße werden verwendet, um zu bestimmen, wie eine Verteilung aussieht, ohne dass sie grafisch dargestellt werden muss.

Es gibt zwei Arten von Formmessungen: Schiefe und Kurtosis. Die Schiefe gibt an, wie symmetrisch eine Verteilung ist, während die Kurtosis angibt, wie konzentriert eine Verteilung um ihren Mittelwert ist.

Was sind die Formmaße?

Unter Berücksichtigung der Definition von Formmaßen zeigt dieser Abschnitt, was diese Arten von statistischen Parametern sind.

In der Statistik unterscheiden wir zwei Formmaße:

  • Schiefe : Gibt an, ob eine Verteilung symmetrisch oder asymmetrisch ist.
  • Kurtosis – Gibt an, ob eine Verteilung steil oder flach ist.

Asymmetrie

Es gibt drei Arten von Asymmetrie :

  • Positive Asymmetrie : Die Verteilung weist rechts vom Mittelwert mehr unterschiedliche Werte auf als links davon.
  • Symmetrie : Die Verteilung hat links vom Mittelwert die gleiche Anzahl von Werten wie rechts vom Mittelwert.
  • Negative Schiefe : Die Verteilung hat links vom Mittelwert mehr unterschiedliche Werte als rechts davon.
Arten der Asymmetrie

Asymmetriekoeffizient

Der Schiefekoeffizient oder Asymmetrieindex ist ein statistischer Koeffizient, der dabei hilft, die Asymmetrie einer Verteilung zu bestimmen. Durch die Berechnung des Asymmetriekoeffizienten ist es somit möglich, die Art der Asymmetrie der Verteilung zu kennen, ohne eine grafische Darstellung davon erstellen zu müssen.

Obwohl es verschiedene Formeln zur Berechnung des Asymmetriekoeffizienten gibt und wir sie alle unten sehen werden, erfolgt die Interpretation des Asymmetriekoeffizienten unabhängig von der verwendeten Formel immer wie folgt:

  • Wenn der Schiefekoeffizient positiv ist, ist die Verteilung positiv schief .
  • Wenn der Schiefekoeffizient Null ist, ist die Verteilung symmetrisch .
  • Wenn der Schiefekoeffizient negativ ist, ist die Verteilung negativ schief .
Fishers Asymmetriekoeffizient

Der Schiefekoeffizient nach Fisher entspricht dem dritten Moment um den Mittelwert dividiert durch die Standardabweichung der Stichprobe. Daher lautet die Formel für den Fisher-Asymmetriekoeffizienten :

\displaystyle\gamma_1=\frac{\mu_3}{\sigma^3}

Entsprechend kann eine der beiden folgenden Formeln zur Berechnung des Fisher-Koeffizienten verwendet werden:

\displaystyle\gamma_1=\frac{\displaystyle \sum_{i=1}^N\left(x_i-\mu\right)^3}{N\cdot \sigma ^3}

\displaystyle\gamma_1=\frac{\operatorname{E}[X^3] - 3\mu\sigma^2 - \mu^3}{\sigma^3}

Gold

E

ist die mathematische Erwartung,

\mu

das arithmetische Mittel,

\sigma

die Standardabweichung und

N

die Gesamtzahl der Daten.

Wenn die Daten hingegen gruppiert sind, können Sie die folgende Formel verwenden:

\displaystyle\gamma_1=\frac{\displaystyle \sum_{i=1}^N\left(x_i-\mu\right)^3\cdot f_i}{N\cdot \sigma ^3}

Wo in diesem Fall

x_i

Es ist das Zeichen von Klasse und

f_i

die absolute Häufigkeit des Kurses.

Asymmetriekoeffizient nach Pearson

Der Schiefekoeffizient nach Pearson entspricht der Differenz zwischen dem Stichprobenmittelwert und dem Stichprobenmodus dividiert durch seine Standardabweichung (oder Standardabweichung). Die Formel für den Pearson-Asymmetriekoeffizienten lautet daher wie folgt:

A_p=\cfrac{\mu-Mo}{\sigma}

Gold

A_p

ist der Pearson-Koeffizient,

\mu

das arithmetische Mittel,

Mo

Mode und

\sigma

die Standardabweichung.

Beachten Sie, dass der Pearson-Skewness-Koeffizient nur berechnet werden kann, wenn es sich um eine unimodale Verteilung handelt, d. h. wenn die Daten nur einen Modus enthalten.

Bowleys Asymmetriekoeffizient

Der Schiefekoeffizient nach Bowley ist gleich der Summe aus dem dritten Quartil plus dem ersten Quartil minus dem Doppelten des Medians dividiert durch die Differenz zwischen dem dritten und dem ersten Quartil. Die Formel für diesen Asymmetriekoeffizienten lautet daher wie folgt:

A_B=\cfrac{Q_3+Q_1-2\cdot Me}{Q_3-Q_1}

Gold

Q_1

Und

Q_3

sind jeweils das erste und dritte Quartil und

Me

ist der Median der Verteilung.

Abflachung

Kurtosis , auch Schiefe genannt, gibt an, wie konzentriert eine Verteilung um ihren Mittelwert ist. Mit anderen Worten: Kurtosis gibt an, ob eine Verteilung steil oder flach ist. Konkret gilt: Je größer die Kurtosis einer Verteilung, desto steiler (oder schärfer) ist sie.

schmeichelhaft

Es gibt drei Arten von Schmeichelei :

  • Leptokurtic : Die Verteilung ist sehr spitz, das heißt, die Daten konzentrieren sich stark um den Mittelwert. Genauer gesagt werden leptokurtische Verteilungen als Verteilungen definiert, die schärfer als die Normalverteilung sind.
  • Mesokurtic : Die Kurtosis der Verteilung entspricht der Kurtosis der Normalverteilung. Es gilt daher weder als spitz noch als abgeflacht.
  • Platicurtic : Die Verteilung ist sehr abgeflacht, das heißt, die Konzentration um den Mittelwert ist gering. Formal werden platykurtische Verteilungen als Verteilungen definiert, die flacher als die Normalverteilung sind.

Beachten Sie, dass die verschiedenen Kurtosis-Typen anhand der Kurtosis der Normalverteilung als Referenz definiert werden.

Arten der Schmeichelei

Abflachungskoeffizient

Die Formel für den Kurtosis-Koeffizienten lautet wie folgt:

\displaystyle g_2=\frac{1}{N}\cdot\frac{\displaystyle \sum_{i=1}^N(x_i-\mu)^4}{\sigma^4}-3

Die Formel für den Kurtosis-Koeffizienten für in Häufigkeitstabellen gruppierte Daten :

\displaystyle g_2=\frac{1}{N}\cdot\frac{\displaystyle \sum_{i=1}^N f_i\cdot(x_i-\mu)^4}{\sigma^4}-3

Schließlich die Formel für den Kurtosis-Koeffizienten für in Intervalle gruppierte Daten :

\displaystyle g_2=\frac{1}{N}\cdot\frac{\displaystyle \sum_{i=1}^N f_i\cdot(c_i-\mu)^4}{\sigma^4}-3

Gold:

  • g_2

    ist der Kurtosis-Koeffizient.

  • N

    ist die Gesamtzahl der Daten.

  • x_i

    ist der i-te Datenwert in der Reihe.

  • \mu

    ist das arithmetische Mittel der Verteilung.

  • \sigma

    ist die Standardabweichung (oder typische Abweichung) der Verteilung.

  • f_i

    ist die absolute Häufigkeit des it-Datensatzes.

  • c_i

    ist die Klassennote der i-ten Gruppe.

Beachten Sie, dass in allen Kurtosis-Koeffizientenformeln 3 subtrahiert wird, da es sich um den Kurtosis-Wert der Normalverteilung handelt. Daher erfolgt die Berechnung des Kurtosis-Koeffizienten unter Verwendung der Kurtosis der Normalverteilung als Referenz. Aus diesem Grund heißt es in der Statistik manchmal, dass eine übermäßige Kurtosis berechnet wird.

Nachdem der Kurtosis-Koeffizient berechnet wurde, muss er wie folgt interpretiert werden, um festzustellen, um welche Art von Kurtosis es sich handelt:

  • Wenn der Kurtosis-Koeffizient positiv ist, bedeutet dies, dass die Verteilung leptokurtisch ist.
  • Wenn der Kurtosis-Koeffizient Null ist, bedeutet dies, dass die Verteilung mesokurtisch ist.
  • Wenn der Kurtosis-Koeffizient negativ ist, bedeutet dies, dass die Verteilung platykurtisch ist.

Andere Arten statistischer Maße

Möglicherweise interessieren Sie sich auch für eine der folgenden statistischen Kennzahlen. Klicken Sie auf eine, um zu sehen, was sie sind und wie sie berechnet werden.

Einen Kommentar hinzufügen

Deine E-Mail-Adresse wird nicht veröffentlicht. Erforderliche Felder sind mit * markiert