So berechnen sie punktschätzungen in r (mit beispielen)
Eine Punktschätzung stellt eine Zahl dar, die wir aus Stichprobendaten berechnen, um einen Populationsparameter zu schätzen. Dies ist unsere bestmögliche Schätzung des tatsächlichen Bevölkerungsparameters.
Die folgende Tabelle zeigt die Punktschätzung, die wir zur Schätzung der Populationsparameter verwenden:
Die Maßnahme | Bevölkerungsparameter | Punktschätzung |
---|---|---|
Bedeuten | μ (Bevölkerungsdurchschnitt) | x (Stichprobendurchschnitt) |
Anteil | π (Anteil der Bevölkerung) | p (Stichprobenanteil) |
Die folgenden Beispiele zeigen, wie Punktschätzungen für einen Bevölkerungsmittelwert und einen Bevölkerungsanteil in R berechnet werden.
Beispiel 1: Punktschätzung des Grundgesamtheitsmittelwerts
Nehmen wir an, wir möchten die durchschnittliche Höhe (in Zoll) einer bestimmten Pflanzenart auf einem bestimmten Feld schätzen. Wir sammeln eine einfache Zufallsstichprobe von 13 Pflanzen und messen die Höhe jeder Pflanze.
Der folgende Code zeigt, wie der Stichprobenmittelwert berechnet wird:
#define data data <- c(8, 8, 9, 12, 13, 13, 14, 15, 19, 22, 23, 23, 24) #calculate sample mean mean(data, na. rm = TRUE ) [1] 15.61538
Der Stichprobendurchschnitt liegt bei 15,6 Zoll. Dies stellt unsere Punktschätzung des Bevölkerungsmittelwerts dar.
Wir können auch den folgenden Code verwenden, um ein 95 %-Konfidenzintervall für den Grundgesamtheitsmittelwert zu berechnen:
#find sample size, sample mean, and sample standard deviation n <- length(data) xbar <- mean(data, na. rm = TRUE ) s <- sd(data) #calculate margin of error margin <- qt(0.975,df=n-1)*s/sqrt(n) #calculate lower and upper bounds of confidence interval low <- xbar - margin low [1] 12.03575 high <- xbar + margin high [1] 19.19502
Das 95 %-Konfidenzintervall für den Bevölkerungsmittelwert beträgt [12,0, 19,2] Zoll.
Beispiel 2: Punktschätzung des Bevölkerungsanteils
Angenommen, wir möchten den Anteil der Menschen in einer bestimmten Stadt schätzen, die ein bestimmtes Gesetz unterstützen. Wir befragen eine einfache Zufallsstichprobe von 20 Bürgern.
Der folgende Code zeigt, wie der Stichprobenanteil berechnet wird:
#define data data <- c('Y', 'Y', 'Y', 'N', 'N', 'Y', 'Y', 'Y', 'N', 'Y', 'N', 'Y', 'Y', 'N', 'N', 'Y', 'Y', 'Y', 'N', 'N') #find total sample size n <- length(data) #find number who responded 'Yes' k <- sum(data == ' Y ') #find sample proportion p <- k/n p [1] 0.6
Der Anteil der Befürworter des Gesetzes in der Stichprobe beträgt 0,6 . Dies stellt unsere Punktschätzung des Bevölkerungsanteils dar.
Wir können auch den folgenden Code verwenden, um ein 95 %-Konfidenzintervall für den Grundgesamtheitsmittelwert zu berechnen:
#find total sample size n <- length(data) #find number who responded 'Yes' k <- sum(data == ' Y ') #find sample proportion p <- k/n #calculate margin of error margin <- qnorm(0.975)*sqrt(p*(1-p)/n) #calculate lower and upper bounds of confidence interval low <- p - margin low [1] 0.3852967 high <- p + margin high [1] 0.8147033
Das 95 %-Konfidenzintervall für den Bevölkerungsanteil beträgt [0,39, 0,81] .
Zusätzliche Ressourcen
So berechnen Sie die Zusammenfassung von fünf Zahlen in R
So finden Sie Konfidenzintervalle in R
So zeichnen Sie ein Konfidenzintervall in R auf