Wann sollte der mittelwert vs. verwendet werden? median: mit beispielen


Der Mittelwert eines Datensatzes stellt den Durchschnittswert des Datensatzes dar. Es wird wie folgt berechnet:

Durchschnitt = Σx i / n

Gold:

  • Σ: Ein Symbol, das „Summe“ bedeutet
  • x i : Die i- te Beobachtung in einem Datensatz
  • n: die Gesamtzahl der Beobachtungen im Datensatz

Der Median stellt den Mittelwert eines Datensatzes dar. Er wird berechnet, indem alle Beobachtungen in einem Datensatz vom kleinsten zum größten geordnet werden und dann der Medianwert ermittelt wird.

Angenommen, wir haben den folgenden Datensatz mit 11 Beobachtungen :

Datensatz: 3, 4, 4, 6, 7, 8, 12, 13, 15, 16, 17

Der Durchschnitt des Datensatzes wird wie folgt berechnet:

Durchschnitt = (3+4+4+6+7+8+12+13+15+16+17) / 11 = 9,54

Der Median des Datensatzes ist der Wert direkt in der Mitte, der 8 beträgt:

3, 4, 4, 6, 7 , 8, 12, 13, 15, 16, 17

Die mittlere und mittlere Schätzung, wo sich das Zentrum eines Datensatzes befindet. Abhängig von der Art der Daten kann jedoch der Mittelwert oder Median nützlicher sein, um die Mitte des Datensatzes zu beschreiben.

Wann sollte der Durchschnitt verwendet werden?

Es ist am besten, den Mittelwert zur Beschreibung der Mitte eines Datensatzes zu verwenden, wenn die Verteilung im Wesentlichen symmetrisch ist und es keine Ausreißer gibt.

Angenommen, wir haben die folgende Verteilung, die die Gehälter der Einwohner einer bestimmten Stadt zeigt:

Da diese Verteilung ziemlich symmetrisch ist (wenn man sie in der Mitte aufteilt, würde jede Hälfte ungefähr gleich aussehen) und es keine Ausreißer gibt, können wir den Mittelwert verwenden, um die Mitte dieses Datensatzes zu beschreiben.

Der Durchschnitt liegt bei 63.000 US-Dollar, was ungefähr in der Mitte der Verteilung liegt:

Wann ist der Median zu verwenden?

Es ist am besten, den Median zu verwenden, wenn die Verteilung schief ist oder Ausreißer vorhanden sind.

Verzerrte Daten:

Wenn eine Verteilung schief ist, beschreibt der Median das Zentrum der Verteilung besser als der Mittelwert.

Betrachten Sie beispielsweise die folgende Verteilung der Gehälter der Einwohner einer bestimmten Stadt:

Der Median spiegelt das „typische“ Gehalt eines Bewohners besser wider als der Durchschnitt. Dies liegt daran, dass hohe Werte am Ende der Verteilung dazu neigen, den Mittelwert von der Mitte weg und in Richtung des langen Endes zu verschieben.

In diesem Beispiel sagt uns der Durchschnitt, dass eine typische Person etwa 47.000 US-Dollar pro Jahr verdient, während der Median uns sagt, dass die typische Person nur etwa 32.000 US-Dollar pro Jahr verdient, was für die typische Person viel repräsentativer ist.

Ausreißer:

Der Median hilft auch dabei, die zentrale Position einer Verteilung besser zu erfassen, wenn die Daten Ausreißer enthalten. Betrachten Sie beispielsweise die folgende Grafik, die die Quadratmeterzahl von Häusern in einer bestimmten Straße zeigt:

Wann sollte der Mittelwert gegenüber dem Median verwendet werden?

Der Durchschnitt wird stark von einigen wenigen extrem großen Häusern beeinflusst, während dies beim Median nicht der Fall ist. Somit erfasst der Median die „typische“ Quadratmeterzahl eines Hauses in dieser Straße besser als der Durchschnitt.

Zusammenfassung

In Summe:

  • Mittelwert und Median können verwendet werden, um zu beschreiben, wo sich das „Zentrum“ eines Datensatzes befindet.
  • Es ist am besten, den Durchschnitt zu verwenden, wenn die Verteilung der Datenwerte symmetrisch ist und es keine klaren Ausreißer gibt.
  • Es ist am besten, den Median zu verwenden, wenn die Verteilung der Datenwerte verzerrt ist oder wenn es offensichtliche Ausreißer gibt.

Zusätzliche Ressourcen

Wie wirken sich Ausreißer auf den Mittelwert aus?
So schätzen Sie den Mittelwert und den Median eines beliebigen Histogramms
So ermitteln Sie den Mittelwert und den Median von Stamm- und Blattdiagrammen

Einen Kommentar hinzufügen

Deine E-Mail-Adresse wird nicht veröffentlicht. Erforderliche Felder sind mit * markiert