Come calcolare le stime puntuali in r (con esempi)


Una stima puntuale rappresenta un numero che calcoliamo dai dati campione per stimare un parametro della popolazione. Questa è la nostra migliore stima possibile di quale potrebbe essere il vero parametro della popolazione.

La tabella seguente mostra la stima puntuale che utilizziamo per stimare i parametri della popolazione:

La misura Parametro della popolazione Stima puntuale
Significare μ (media della popolazione) x (media campionaria)
Proporzione π (proporzione della popolazione) p (proporzione del campione)

Gli esempi seguenti dimostrano come calcolare le stime puntuali per la media della popolazione e la proporzione della popolazione in R.

Esempio 1: stima puntuale della media della popolazione

Diciamo che vogliamo stimare l’altezza media (in pollici) di un certo tipo di pianta in un certo campo. Raccogliamo un semplice campione casuale di 13 piante e misuriamo l’altezza di ciascuna pianta.

Il codice seguente mostra come calcolare la media campionaria:

 #define data
data <- c(8, 8, 9, 12, 13, 13, 14, 15, 19, 22, 23, 23, 24)

#calculate sample mean
mean(data, na. rm = TRUE )

[1] 15.61538

La media del campione è 15,6 pollici. Questo rappresenta la nostra stima puntuale della media della popolazione.

Possiamo anche utilizzare il seguente codice per calcolare un intervallo di confidenza al 95% per la media della popolazione:

 #find sample size, sample mean, and sample standard deviation
n <- length(data)
xbar <- mean(data, na. rm = TRUE )
s <- sd(data)

#calculate margin of error
margin <- qt(0.975,df=n-1)*s/sqrt(n)

#calculate lower and upper bounds of confidence interval
low <- xbar - margin
low

[1] 12.03575

high <- xbar + margin
high

[1] 19.19502

L’intervallo di confidenza al 95% per la media della popolazione è [12,0, 19,2] pollici.

Esempio 2: stima puntuale della proporzione della popolazione

Supponiamo di voler stimare la percentuale di persone in una determinata città che sostengono una determinata legge. Intervistiamo un campione casuale semplice di 20 cittadini.

Il codice seguente mostra come calcolare la proporzione campionaria:

 #define data
data <- c('Y', 'Y', 'Y', 'N', 'N', 'Y', 'Y', 'Y', 'N', 'Y',
          'N', 'Y', 'Y', 'N', 'N', 'Y', 'Y', 'Y', 'N', 'N')

#find total sample size
n <- length(data)

#find number who responded 'Yes'
k <- sum(data == ' Y ') 

#find sample proportion
p <- k/n

p

[1] 0.6

La proporzione del campione di cittadini che sostengono la legge è 0,6 . Questo rappresenta la nostra stima puntuale della proporzione della popolazione.

Possiamo anche utilizzare il seguente codice per calcolare un intervallo di confidenza al 95% per la media della popolazione:

 #find total sample size
n <- length(data)

#find number who responded 'Yes'
k <- sum(data == ' Y ') 

#find sample proportion
p <- k/n

#calculate margin of error
margin <- qnorm(0.975)*sqrt(p*(1-p)/n)

#calculate lower and upper bounds of confidence interval
low <- p - margin
low

[1] 0.3852967

high <- p + margin
high

[1] 0.8147033

L’intervallo di confidenza al 95% per la proporzione della popolazione è [0,39, 0,81] .

Risorse addizionali

Come calcolare la sintesi di cinque numeri in R
Come trovare gli intervalli di confidenza in R
Come tracciare un intervallo di confidenza in R

Aggiungi un commento

Il tuo indirizzo email non sarà pubblicato. I campi obbligatori sono contrassegnati *