Comment calculer des estimations ponctuelles dans R (avec exemples)



Une estimation ponctuelle représente un nombre que nous calculons à partir de données d’échantillon pour estimer un paramètre de population. Cela constitue notre meilleure estimation possible de ce que peut être le véritable paramètre de population.

Le tableau suivant montre l’estimation ponctuelle que nous utilisons pour estimer les paramètres de population :

La mesure Paramètre de population Estimation ponctuelle
Signifier μ (moyenne de la population) x (moyenne de l’échantillon)
Proportion π (proportion de la population) p (proportion de l’échantillon)

Les exemples suivants expliquent comment calculer des estimations ponctuelles pour une moyenne de population et une proportion de population dans R.

Exemple 1 : Estimation ponctuelle de la moyenne de la population

Supposons que nous souhaitions estimer la hauteur moyenne (en pouces) d’un certain type de plante dans un certain champ. Nous recueillons un échantillon aléatoire simple de 13 plantes et mesurons la hauteur de chaque plante.

Le code suivant montre comment calculer la moyenne de l’échantillon :

#define data
data <- c(8, 8, 9, 12, 13, 13, 14, 15, 19, 22, 23, 23, 24)

#calculate sample mean
mean(data, na.rm = TRUE)

[1] 15.61538

La moyenne de l’échantillon est de 15,6 pouces. Cela représente notre estimation ponctuelle de la moyenne de la population.

Nous pouvons également utiliser le code suivant pour calculer un intervalle de confiance à 95 % pour la moyenne de la population :

#find sample size, sample mean, and sample standard deviation
n <- length(data)
xbar <- mean(data, na.rm = TRUE)
s <- sd(data)

#calculate margin of error
margin <- qt(0.975,df=n-1)*s/sqrt(n)

#calculate lower and upper bounds of confidence interval
low <- xbar - margin
low

[1] 12.03575

high <- xbar + margin
high

[1] 19.19502

L’intervalle de confiance à 95 % pour la moyenne de la population est de [12,0, 19,2] pouces.

Exemple 2 : Estimation ponctuelle de la proportion de la population

Supposons que nous souhaitions estimer la proportion de personnes dans une certaine ville qui soutiennent une certaine loi. Nous interrogeons un échantillon aléatoire simple de 20 citoyens.

Le code suivant montre comment calculer la proportion d’échantillon :

#define data
data <- c('Y', 'Y', 'Y', 'N', 'N', 'Y', 'Y', 'Y', 'N', 'Y',
          'N', 'Y', 'Y', 'N', 'N', 'Y', 'Y', 'Y', 'N', 'N')

#find total sample size
n <- length(data)

#find number who responded 'Yes'
k <- sum(data == 'Y') 

#find sample proportion
p <- k/n

p

[1] 0.6

La proportion de l’échantillon de citoyens qui soutiennent la loi est de 0,6 . Cela représente notre estimation ponctuelle de la proportion de population.

Nous pouvons également utiliser le code suivant pour calculer un intervalle de confiance à 95 % pour la moyenne de la population :

#find total sample size
n <- length(data)

#find number who responded 'Yes'
k <- sum(data == 'Y') 

#find sample proportion
p <- k/n

#calculate margin of error
margin <- qnorm(0.975)*sqrt(p*(1-p)/n)

#calculate lower and upper bounds of confidence interval
low <- p - margin
low

[1] 0.3852967

high <- p + margin
high

[1] 0.8147033

L’intervalle de confiance à 95 % pour la proportion de population est [0,39, 0,81] .

Ressources additionnelles

Comment calculer le résumé de cinq nombres dans R
Comment trouver des intervalles de confiance dans R
Comment tracer un intervalle de confiance dans R

Ajouter un commentaire

Votre adresse e-mail ne sera pas publiée. Les champs obligatoires sont indiqués avec *