So wenden sie die faustregel in r an
Die Faustregel , manchmal auch 68-95-99,7-Regel genannt, besagt, dass für einen gegebenen Datensatz mit einer Normalverteilung:
- 68 % der Datenwerte liegen innerhalb einer Standardabweichung vom Mittelwert.
- 95 % der Datenwerte liegen innerhalb von zwei Standardabweichungen vom Mittelwert.
- 99,7 % der Datenwerte liegen innerhalb von drei Standardabweichungen vom Mittelwert.
In diesem Tutorial erklären wir, wie man die Faustregel in R auf einen bestimmten Datensatz anwendet.
Anwendung der Faustregel in R
Die Funktion pnorm() in R gibt den Wert der kumulativen Dichtefunktion der Normalverteilung zurück.
Diese Funktion verwendet die folgende grundlegende Syntax:
pnorm(q, Mittelwert, SD)
Gold:
- q : normalverteilter Zufallsvariablenwert
- Mittelwert : Mittelwertverteilung
- sd : Standardabweichung der Verteilung
Mit der folgenden Syntax können wir die Fläche unter der Normalverteilungskurve ermitteln, die zwischen verschiedenen Standardabweichungen liegt:
#find area under normal curve within 1 standard deviation of mean pnorm(1) - pnorm(-1) [1] 0.6826895 #find area under normal curve within 2 standard deviations of mean pnorm(2) - pnorm(-2) [1] 0.9544997 #find area under normal curve within 3 standard deviations of mean pnorm(3) - pnorm(-3) [1] 0.9973002
Aus dem Ergebnis können wir bestätigen:
- 68 % der Datenwerte liegen innerhalb einer Standardabweichung vom Mittelwert.
- 95 % der Datenwerte liegen innerhalb von zwei Standardabweichungen vom Mittelwert.
- 99,7 % der Datenwerte liegen innerhalb von drei Standardabweichungen vom Mittelwert.
Die folgenden Beispiele zeigen, wie die Faustregel bei verschiedenen Datensätzen in der Praxis angewendet werden kann.
Beispiel 1: Anwenden der empirischen Regel auf einen Datensatz in R
Angenommen, wir haben einen normalverteilten Datensatz mit einem Mittelwert von 7 und einer Standardabweichung von 2,2 .
Mit dem folgenden Code können wir ermitteln, welche Werte 68 %, 95 % und 99,7 % der Daten enthalten:
#define mean and standard deviation values mean=7 sd=2.2 #find which values contain 68% of data mean-2.2; mean+2.2 [1] 4.8 [1] 9.2 #find which values contain 95% of data mean-2*2.2; mean+2*2.2 [1] 2.6 [1] 11.4 #find which values contain 99.7% of data mean-3*2.2; mean+3*2.2 [1] 0.4 [1] 13.6
Aus dieser Ausgabe können wir sehen:
- 68 % der Daten liegen zwischen 4,8 und 9,2
- 95 % der Daten liegen zwischen 2,6 und 11,4
- 99,7 % der Daten liegen zwischen 0,4 und 13,6
Beispiel 2: Bestimmen Sie, wie viel Prozent der Daten zwischen bestimmten Werten liegen
Stellen Sie sich vor, wir haben einen normalverteilten Datensatz mit einem Mittelwert von 100 und einer Standardabweichung von 5.
Angenommen, wir möchten wissen, wie viel Prozent der Daten in dieser Verteilung zwischen den Werten 99 und 105 liegen.
Wir können die Funktion pnorm( ) verwenden, um die Antwort zu finden:
#find area under normal curve between 99 and 105
pnorm(105, mean=100, sd=5) - pnorm(99, mean=100, sd=5)
[1] 0.4206045
Wir sehen, dass 42,06 % der Daten für diese Verteilung zwischen den Werten 99 und 105 liegen.
Zusätzliche Ressourcen
So wenden Sie die Faustregel in Excel an
Probleme bei der Anwendung von Faustregeln
Faustregelrechner