Was ist sturges? herrscher? (definition & #038; beispiel)


Ein Histogramm ist ein Diagramm, das uns hilft, die Verteilung von Werten in einem Datensatz zu visualisieren.

Es stellt sich heraus, dass die Anzahl der in einem Histogramm verwendeten Kästchen einen großen Einfluss darauf haben kann, wie wir Daten interpretieren.

Wenn wir zu wenige Gruppen verwenden, kann das wahre zugrunde liegende Muster in den Daten verborgen bleiben:

Und wenn wir zu viele Gruppen verwenden, können wir das Rauschen einfach in einem Datensatz visualisieren:

Glücklicherweise können wir eine Methode namens Sturges-Regel verwenden, um die optimale Anzahl von Kästchen für die Verwendung in einem Histogramm zu bestimmen.

Die Sturges-Regel verwendet die folgende Formel, um die optimale Anzahl von Gruppen für die Verwendung in einem Histogramm zu bestimmen:

Optimale Bins = ⌈log 2 n + 1⌉

Gold:

  • n: die Gesamtzahl der Beobachtungen im Datensatz.
  • ⌈ ⌉: Symbole, die „Obergrenze“ bedeuten, also das Runden des Ergebnisses auf die nächste ganze Zahl.

Beispiel: Sturges-Regel

Angenommen, wir haben den folgenden Datensatz mit insgesamt n = 31 Beobachtungen:

Wir können die Sturges-Regel verwenden, um die optimale Anzahl von Kästchen zu bestimmen, die zur Visualisierung dieser Werte in einem Histogramm verwendet werden sollen:

Optimale Bins = ⌈log 2 (31) + 1⌉ = ⌈4,954 + 1⌉ = ⌈5,954⌉ = 6 .

Gemäß der Sturges-Regel sollten wir in dem Histogramm, das wir zur Visualisierung dieser Werteverteilung verwenden, 6 Bins verwenden.

So würde ein Histogramm mit 6 Gruppen für diesen Datensatz aussehen:

Verwenden der Sturges-Regel zur Bestimmung der Anzahl der in einem Histogramm zu verwendenden Felder

Beachten Sie, dass dies ausreichend zu sein scheint, um eine gute Vorstellung von der zugrunde liegenden Werteverteilung zu erhalten, ohne zu zahlreich zu sein, um das Rauschen in den Daten einfach zu visualisieren.

Gemeinsame Werte für die Sturges-Regel

Die folgende Tabelle zeigt die optimale Anzahl von Gruppen zur Verwendung in einem Histogramm basierend auf der Gesamtzahl der Beobachtungen in einem Datensatz gemäß der Sturges-Regel:

Sturges-Regel für verschiedene Stichprobengrößen

Alternativen zur Sturges-Regel

Die Sturges-Regel ist die gebräuchlichste Methode zur Bestimmung der optimalen Anzahl von Bins für die Verwendung in einem Histogramm. Es gibt jedoch mehrere alternative Methoden, darunter:

Die Quadratwurzelregel : Anzahl der Kästchen = ⌈√ n

Die Reisregel: Anzahl der Behälter = ⌈2 * 3n

Die Freedman-Diaconis-Regel: Anzahl der Kästchen = (2*IQR) / 3n wobei IQR der Interquartilbereich ist.

Bonus: Sturges-Regelrechner

Verwenden Sie diesen kostenlosen Online-Rechner, um die Sturges-Regel automatisch anzuwenden und die optimale Anzahl von Gruppen für ein Histogramm basierend auf der Größe eines Datensatzes zu bestimmen.

Einen Kommentar hinzufügen

Deine E-Mail-Adresse wird nicht veröffentlicht. Erforderliche Felder sind mit * markiert