So berechnen sie punktschätzungen in r (mit beispielen)


Eine Punktschätzung stellt eine Zahl dar, die wir aus Stichprobendaten berechnen, um einen Populationsparameter zu schätzen. Dies ist unsere bestmögliche Schätzung des tatsächlichen Bevölkerungsparameters.

Die folgende Tabelle zeigt die Punktschätzung, die wir zur Schätzung der Populationsparameter verwenden:

Die Maßnahme Bevölkerungsparameter Punktschätzung
Bedeuten μ (Bevölkerungsdurchschnitt) x (Stichprobendurchschnitt)
Anteil π (Anteil der Bevölkerung) p (Stichprobenanteil)

Die folgenden Beispiele zeigen, wie Punktschätzungen für einen Bevölkerungsmittelwert und einen Bevölkerungsanteil in R berechnet werden.

Beispiel 1: Punktschätzung des Grundgesamtheitsmittelwerts

Nehmen wir an, wir möchten die durchschnittliche Höhe (in Zoll) einer bestimmten Pflanzenart auf einem bestimmten Feld schätzen. Wir sammeln eine einfache Zufallsstichprobe von 13 Pflanzen und messen die Höhe jeder Pflanze.

Der folgende Code zeigt, wie der Stichprobenmittelwert berechnet wird:

 #define data
data <- c(8, 8, 9, 12, 13, 13, 14, 15, 19, 22, 23, 23, 24)

#calculate sample mean
mean(data, na. rm = TRUE )

[1] 15.61538

Der Stichprobendurchschnitt liegt bei 15,6 Zoll. Dies stellt unsere Punktschätzung des Bevölkerungsmittelwerts dar.

Wir können auch den folgenden Code verwenden, um ein 95 %-Konfidenzintervall für den Grundgesamtheitsmittelwert zu berechnen:

 #find sample size, sample mean, and sample standard deviation
n <- length(data)
xbar <- mean(data, na. rm = TRUE )
s <- sd(data)

#calculate margin of error
margin <- qt(0.975,df=n-1)*s/sqrt(n)

#calculate lower and upper bounds of confidence interval
low <- xbar - margin
low

[1] 12.03575

high <- xbar + margin
high

[1] 19.19502

Das 95 %-Konfidenzintervall für den Bevölkerungsmittelwert beträgt [12,0, 19,2] Zoll.

Beispiel 2: Punktschätzung des Bevölkerungsanteils

Angenommen, wir möchten den Anteil der Menschen in einer bestimmten Stadt schätzen, die ein bestimmtes Gesetz unterstützen. Wir befragen eine einfache Zufallsstichprobe von 20 Bürgern.

Der folgende Code zeigt, wie der Stichprobenanteil berechnet wird:

 #define data
data <- c('Y', 'Y', 'Y', 'N', 'N', 'Y', 'Y', 'Y', 'N', 'Y',
          'N', 'Y', 'Y', 'N', 'N', 'Y', 'Y', 'Y', 'N', 'N')

#find total sample size
n <- length(data)

#find number who responded 'Yes'
k <- sum(data == ' Y ') 

#find sample proportion
p <- k/n

p

[1] 0.6

Der Anteil der Befürworter des Gesetzes in der Stichprobe beträgt 0,6 . Dies stellt unsere Punktschätzung des Bevölkerungsanteils dar.

Wir können auch den folgenden Code verwenden, um ein 95 %-Konfidenzintervall für den Grundgesamtheitsmittelwert zu berechnen:

 #find total sample size
n <- length(data)

#find number who responded 'Yes'
k <- sum(data == ' Y ') 

#find sample proportion
p <- k/n

#calculate margin of error
margin <- qnorm(0.975)*sqrt(p*(1-p)/n)

#calculate lower and upper bounds of confidence interval
low <- p - margin
low

[1] 0.3852967

high <- p + margin
high

[1] 0.8147033

Das 95 %-Konfidenzintervall für den Bevölkerungsanteil beträgt [0,39, 0,81] .

Zusätzliche Ressourcen

So berechnen Sie die Zusammenfassung von fünf Zahlen in R
So finden Sie Konfidenzintervalle in R
So zeichnen Sie ein Konfidenzintervall in R auf

Einen Kommentar hinzufügen

Deine E-Mail-Adresse wird nicht veröffentlicht. Erforderliche Felder sind mit * markiert