Come calcolare le stime puntuali in r (con esempi)
Una stima puntuale rappresenta un numero che calcoliamo dai dati campione per stimare un parametro della popolazione. Questa è la nostra migliore stima possibile di quale potrebbe essere il vero parametro della popolazione.
La tabella seguente mostra la stima puntuale che utilizziamo per stimare i parametri della popolazione:
La misura | Parametro della popolazione | Stima puntuale |
---|---|---|
Significare | μ (media della popolazione) | x (media campionaria) |
Proporzione | π (proporzione della popolazione) | p (proporzione del campione) |
Gli esempi seguenti dimostrano come calcolare le stime puntuali per la media della popolazione e la proporzione della popolazione in R.
Esempio 1: stima puntuale della media della popolazione
Diciamo che vogliamo stimare l’altezza media (in pollici) di un certo tipo di pianta in un certo campo. Raccogliamo un semplice campione casuale di 13 piante e misuriamo l’altezza di ciascuna pianta.
Il codice seguente mostra come calcolare la media campionaria:
#define data data <- c(8, 8, 9, 12, 13, 13, 14, 15, 19, 22, 23, 23, 24) #calculate sample mean mean(data, na. rm = TRUE ) [1] 15.61538
La media del campione è 15,6 pollici. Questo rappresenta la nostra stima puntuale della media della popolazione.
Possiamo anche utilizzare il seguente codice per calcolare un intervallo di confidenza al 95% per la media della popolazione:
#find sample size, sample mean, and sample standard deviation n <- length(data) xbar <- mean(data, na. rm = TRUE ) s <- sd(data) #calculate margin of error margin <- qt(0.975,df=n-1)*s/sqrt(n) #calculate lower and upper bounds of confidence interval low <- xbar - margin low [1] 12.03575 high <- xbar + margin high [1] 19.19502
L’intervallo di confidenza al 95% per la media della popolazione è [12,0, 19,2] pollici.
Esempio 2: stima puntuale della proporzione della popolazione
Supponiamo di voler stimare la percentuale di persone in una determinata città che sostengono una determinata legge. Intervistiamo un campione casuale semplice di 20 cittadini.
Il codice seguente mostra come calcolare la proporzione campionaria:
#define data data <- c('Y', 'Y', 'Y', 'N', 'N', 'Y', 'Y', 'Y', 'N', 'Y', 'N', 'Y', 'Y', 'N', 'N', 'Y', 'Y', 'Y', 'N', 'N') #find total sample size n <- length(data) #find number who responded 'Yes' k <- sum(data == ' Y ') #find sample proportion p <- k/n p [1] 0.6
La proporzione del campione di cittadini che sostengono la legge è 0,6 . Questo rappresenta la nostra stima puntuale della proporzione della popolazione.
Possiamo anche utilizzare il seguente codice per calcolare un intervallo di confidenza al 95% per la media della popolazione:
#find total sample size n <- length(data) #find number who responded 'Yes' k <- sum(data == ' Y ') #find sample proportion p <- k/n #calculate margin of error margin <- qnorm(0.975)*sqrt(p*(1-p)/n) #calculate lower and upper bounds of confidence interval low <- p - margin low [1] 0.3852967 high <- p + margin high [1] 0.8147033
L’intervallo di confidenza al 95% per la proporzione della popolazione è [0,39, 0,81] .
Risorse addizionali
Come calcolare la sintesi di cinque numeri in R
Come trovare gli intervalli di confidenza in R
Come tracciare un intervallo di confidenza in R