Variabilitätsmaße

In diesem Artikel wird erläutert, was Variabilitätsmaße sind und wofür diese Art statistischer Maße verwendet wird. Sie erfahren also die Definition eines Variabilitätsmaßes, welche verschiedenen Arten von Variabilitätsmaßen es gibt und wie Variabilitätsmaße berechnet werden.

Was sind Variabilitätsmaße?

Variabilitätsmaße sind statistische Maße, die die Variabilität eines Datensatzes angeben. Mit anderen Worten: Variabilitätsmaße messen die Streuung einer Datenreihe.

Daher werden Variabilitätsmaße verwendet, um die Streuung von Werten in einer Stichprobe zu ermitteln. Je höher der Wert eines Variabilitätsmaßes ist, desto weiter liegen die Daten in der Stichprobe voneinander entfernt. Im Allgemeinen ist es wichtig, dass die Datenproben nahe beieinander liegen. Deshalb versuchen wir normalerweise, die Variabilitätsmessungen zu minimieren.

In der Statistik sind Variabilitätsmaße wichtig, weil sie es uns ermöglichen, die Repräsentativität eines Zentralisierungsmaßes im Datensatz zu ermitteln. Wenn die Werte der Variabilitätsmaße niedrig sind, bedeutet dies, dass die Daten sehr konzentriert sind und die Zentralisierungsmaße daher die gesamten Daten gut beschreiben.

Variabilitätsmaße können auch Streumaße oder Ausbreitungsmaße genannt werden.

Was sind die Variabilitätsmaße?

Die Variabilitätsmaße lauten wie folgt:

  • Standardabweichung (oder Standardabweichung)
  • Varianz
  • Variationskoeffizient
  • Ordentlich
  • Interquartilbereich
  • mittlerer Unterschied

Im Folgenden wird erläutert, wie die einzelnen Arten von Variabilitätsmaßen berechnet werden

Standardabweichung

Die Standardabweichung , auch typische Abweichung genannt, ist gleich der Quadratwurzel der Summe der Quadrate der Abweichungen der Datenreihe dividiert durch die Gesamtzahl der Beobachtungen.

Daher lautet die Formel für dieses Variabilitätsmaß wie folgt:

\displaystyle\sigma=\sqrt{\frac{\displaystyle\sum_{i=1}^N(x_i-\overline{x})^2}{N}}

Varianz

Die Varianz entspricht der Summe der Quadrate der Residuen über die Gesamtzahl der Beobachtungen. Die Formel für diese Variabilitätsmetrik lautet daher wie folgt:

Var(X)=\cfrac{\displaystyle\sum_{i=1}^n\left(x_i-\overline{x}\right)^2}{n}

Gold:

  • X

    ist die Zufallsvariable, für die Sie die Varianz berechnen möchten.

  • x_i

    ist der Datenwert

    i

    .

  • n

    ist die Gesamtzahl der Beobachtungen.

  • \overline{X}

    ist der Mittelwert der Zufallsvariablen

    X

    .

Variationskoeffizient

In der Statistik ist der Variationskoeffizient ein Maß für die Variabilität, mit dem die Streuung eines Datensatzes relativ zu seinem Mittelwert bestimmt wird. Der Variationskoeffizient wird berechnet, indem die Standardabweichung der Daten durch ihren Mittelwert dividiert und dann mit 100 multipliziert wird, um den Wert als Prozentsatz auszudrücken.

CV=\cfrac{\sigma}{\overline{x}}\cdot 100

Ordentlich

Der Bereich ist ein Maß für die Variabilität, das den Unterschied zwischen dem Maximal- und Minimalwert der Daten in einer Stichprobe angibt. Um den Umfang einer Grundgesamtheit oder statistischen Stichprobe zu berechnen, muss daher der Maximalwert vom Minimalwert abgezogen werden.

R=\text{M\'ax}-\text{M\'in}

Interquartilbereich

Der Interquartilabstand , auch Interquartilabstand genannt, ist ein Maß für die statistische Variabilität, das den Unterschied zwischen dem dritten und dem ersten Quartil angibt.

Um den Interquartilbereich eines statistischen Datensatzes zu berechnen, müssen Sie daher zunächst das dritte und erste Quartil ermitteln und diese dann subtrahieren.

IQR=Q_3-Q_1

Das Symbol für den Interquartilbereich ist IQR, abgeleitet vom englischen Interquartilbereich .

Eine der vorteilhaftesten Eigenschaften dieses Variabilitätsmaßes besteht darin, dass es sich um eine robuste Statistik handelt, das heißt, sie weist eine hohe Robustheit gegenüber Ausreißern auf. Da Extremwerte bei der Berechnung des Interquartilbereichs nicht berücksichtigt werden, ändert sich sein Wert kaum, wenn neue Ausreißer auftreten.

mittlerer Unterschied

Die mittlere Abweichung , auch mittlere absolute Abweichung genannt, ist der Durchschnitt der absoluten Abweichungen. Die durchschnittliche Abweichung ist daher gleich der Summe der Abweichungen jedes Datenelements vom arithmetischen Mittel geteilt durch die Gesamtzahl der Datenelemente.

D_{\overline{x}}=\cfrac{\sum_{i=1}^N|x_i-\overline{x}|}{N}

Einen Kommentar hinzufügen

Deine E-Mail-Adresse wird nicht veröffentlicht. Erforderliche Felder sind mit * markiert