Atypische werte (ausreißer)

In diesem Artikel wird erklärt, was Ausreißer sind und wie sie berechnet werden. Darüber hinaus können Sie mit einem Online-Rechner Ausreißer für jede Datenstichprobe berechnen.

Was sind Ausreißer?

Als Ausreißer , auch Ausreißer oder Ausreißer genannt, werden in der Statistik Werte bezeichnet, die sich deutlich vom Rest des Datensatzes unterscheiden. Mit anderen Worten, ein Ausreißer ist ein abnormaler Wert, der sich stark von den übrigen Werten in der Stichprobe unterscheidet.

Es ist wichtig, Ausreißer in einer Stichprobe zu identifizieren, da sie die Berechnung statistischer Maße erheblich beeinflussen können.

Wenn wir beispielsweise die Datenreihe [1, 3, 5, 2, 79, 4, 8, 6] haben, ist die Zahl 79 eindeutig ein Ausreißer. Weil sein Wert extrem höher ist als der Rest der Daten. In diesem Fall beträgt der Mittelwert einschließlich des Ausreißers 13,5, während der Mittelwert ohne den Ausreißer 4,14 betragen würde. Wie Sie sehen, beeinflusst bereits ein einzelner Ausreißer das Ergebnis einer statistischen Messung erheblich.

 1, \ 3, \ 5, \ 2, \ 79, \ 4, \ 8, \ 6 \quad \color{orange}\bm{\longrightarrow}\color{black}\quad \text{Valor at\'ipico: } 79

Normalerweise sind Ausreißer in Streudiagrammen leicht zu unterscheiden, da sie vom Rest der Daten isoliert sind. Schauen Sie sich das folgende Streudiagramm an. Der Ausreißer unterscheidet sich stark von den übrigen Werten:

Streudiagramm von Ausreißern oder anderen

👉 Mit dem Rechner unten können Sie Ausreißer für jeden Datensatz ermitteln.

So berechnen Sie Ausreißer

Um Ausreißer aus einer Datenstichprobe zu berechnen, müssen die folgenden Schritte befolgt werden:

  1. Berechnen Sie die Quartile des Datensatzes.
  2. Berechnen Sie den Interquartilbereich der Daten.
  3. Als atypische Werte (Ausreißer) gelten Werte, die eine der folgenden Bedingungen erfüllen:

Im folgenden Boxplot sehen Sie zwei Ausreißer nach diesem Kriterium grafisch dargestellt:

Boxplot-Ausreißer

Hinweis: Beachten Sie, dass es mehrere Kriterien gibt, um die Grenzen zu bestimmen, ab denen Daten als Ausreißer gelten. In diesem Artikel wurde das Tukey-Testkriterium als Referenz herangezogen, da es am häufigsten verwendet wird.

Beispiel für Ausreißer

In diesem Abschnitt sehen wir uns anhand der Definition eines Ausreißers ein praktisches Beispiel für die Identifizierung von Ausreißern in einer Datenreihe an.

  • Berechnen Sie Ausreißer oder Ausreißer aus dem folgenden statistischen Datensatz.

Zunächst berechnen wir die drei Quartile des Datensatzes:

Q_1=4,06

Q_2=4,38

Q_3=4,66

Sobald wir die drei Quartile gefunden haben, ermitteln wir den Interquartilbereich, indem wir Quartil 3 minus Quartil 1 subtrahieren:

IQR=Q_3-Q_1=4,66-4,06=0,6

Und nun berechnen wir die durch die Ausreißer gesetzten Grenzen. Dazu verwenden wir die im obigen Abschnitt erläuterten Formeln:

Q_1-1,5\cdot IQR=4,06-1,5\cdot 0,6=3,16

Q_3+1,5\cdot IQR=4,66+1,5\cdot 0,6=5,56

Wenn also einer der Werte kleiner als 3,16 ist, handelt es sich um einen Ausreißer. Wenn ein Wert größer als 5,56 ist, handelt es sich ebenfalls um einen Ausreißer.

Zusammenfassend lässt sich sagen, dass wir in diesem Fall zwei Extremwerte haben, denn 3,02 ist kleiner als 3,16 und 5,71 ist größer als 5,56.

\text{Valores at\'ipicos} =\Bigl\{3,02 \ ; \ 5,71\Bigr\}

Ausreißerrechner

Geben Sie einen statistischen Datensatz in den folgenden Rechner ein, um etwaige Ausreißer zu berechnen. Die Daten müssen durch ein Leerzeichen getrennt und mit dem Punkt als Dezimaltrennzeichen eingegeben werden.

Ursachen für Ausreißer

Es gibt mehrere mögliche Ursachen für Ausreißer, die häufigsten davon sind:

  • Das zur Messung verwendete Gerät ist ausgefallen oder hat einen Unfall erlitten.
  • Das gemessene Teil wies aufgrund einer ungewöhnlichen Ursache einen Defekt auf.
  • Bei der Übertragung oder Transkription der Daten ist ein Fehler aufgetreten.
  • Es lag ein menschlicher Fehler vor. Ungeachtet der getroffenen Vorsichtsmaßnahmen sind menschliche Fehler nicht völlig unvermeidlich und daher können dennoch abnormale Werte vorliegen.

Dies sind die häufigsten Ursachen, aber der Grund kann natürlich alles sein. Ebenso muss berücksichtigt werden, dass es bei der Durchführung einer statistischen Studie mit zahlreichen Beobachtungen normal ist, dass einige Ausreißer auftreten.

Was tun mit Ausreißern?

Eine häufige Frage, wenn wir auf einen Ausreißer stoßen, ist, was wir damit tun sollen. Sollten Ausreißer aus der Stichprobe entfernt werden?

Es wird davon ausgegangen, dass Ausreißer immer eliminiert werden sollten, da es sich um Daten handelt, die nicht mit dem Rest der Menge übereinstimmen. Auch wenn Ausreißer die Ergebnisse einiger statistischer Messungen stark beeinflussen, heißt das nicht, dass sie immer eliminiert werden sollten.

Im Allgemeinen sollten Ausreißer nur dann entfernt werden, wenn wir wissen, dass die Ursache der Anomalie tatsächlich gerechtfertigt ist und es sich bei diesen Ausreißern daher um Beobachtungen handelt, die nicht mit den untersuchten Daten übereinstimmen.

Dies ist besonders bei kleinen Stichprobengrößen wichtig, da sich Extremwerte dann stärker auf die statistischen Kennzahlen auswirken.

Wenn beispielsweise die Länge eines Teils eines Produkts gemessen wird, um eine Qualitätskontrolle durchzuführen, weicht der gemessene Wert logischerweise stark von den vorherigen ab und wird es wahrscheinlich auch sein, wenn plötzlich ein anderer Produkttyp auftaucht und derselbe Teil gemessen wird ein Ausreißer sein. In diesem Fall könnte der Ausreißer ausgeschlossen werden, da seine Ursache bekannt ist und bekannt ist, dass die gemessenen Daten nicht Teil der zu analysierenden Grundgesamtheit sind.

Einen Kommentar hinzufügen

Deine E-Mail-Adresse wird nicht veröffentlicht. Erforderliche Felder sind mit * markiert