Comment calculer des estimations ponctuelles dans R (avec exemples)
Une estimation ponctuelle représente un nombre que nous calculons à partir de données d’échantillon pour estimer un paramètre de population. Cela constitue notre meilleure estimation possible de ce que peut être le véritable paramètre de population.
Le tableau suivant montre l’estimation ponctuelle que nous utilisons pour estimer les paramètres de population :
La mesure | Paramètre de population | Estimation ponctuelle |
---|---|---|
Signifier | μ (moyenne de la population) | x (moyenne de l’échantillon) |
Proportion | π (proportion de la population) | p (proportion de l’échantillon) |
Les exemples suivants expliquent comment calculer des estimations ponctuelles pour une moyenne de population et une proportion de population dans R.
Exemple 1 : Estimation ponctuelle de la moyenne de la population
Supposons que nous souhaitions estimer la hauteur moyenne (en pouces) d’un certain type de plante dans un certain champ. Nous recueillons un échantillon aléatoire simple de 13 plantes et mesurons la hauteur de chaque plante.
Le code suivant montre comment calculer la moyenne de l’échantillon :
#define data data <- c(8, 8, 9, 12, 13, 13, 14, 15, 19, 22, 23, 23, 24) #calculate sample mean mean(data, na.rm = TRUE) [1] 15.61538
La moyenne de l’échantillon est de 15,6 pouces. Cela représente notre estimation ponctuelle de la moyenne de la population.
Nous pouvons également utiliser le code suivant pour calculer un intervalle de confiance à 95 % pour la moyenne de la population :
#find sample size, sample mean, and sample standard deviation n <- length(data) xbar <- mean(data, na.rm = TRUE) s <- sd(data) #calculate margin of error margin <- qt(0.975,df=n-1)*s/sqrt(n) #calculate lower and upper bounds of confidence interval low <- xbar - margin low [1] 12.03575 high <- xbar + margin high [1] 19.19502
L’intervalle de confiance à 95 % pour la moyenne de la population est de [12,0, 19,2] pouces.
Exemple 2 : Estimation ponctuelle de la proportion de la population
Supposons que nous souhaitions estimer la proportion de personnes dans une certaine ville qui soutiennent une certaine loi. Nous interrogeons un échantillon aléatoire simple de 20 citoyens.
Le code suivant montre comment calculer la proportion d’échantillon :
#define data data <- c('Y', 'Y', 'Y', 'N', 'N', 'Y', 'Y', 'Y', 'N', 'Y', 'N', 'Y', 'Y', 'N', 'N', 'Y', 'Y', 'Y', 'N', 'N') #find total sample size n <- length(data) #find number who responded 'Yes' k <- sum(data == 'Y') #find sample proportion p <- k/n p [1] 0.6
La proportion de l’échantillon de citoyens qui soutiennent la loi est de 0,6 . Cela représente notre estimation ponctuelle de la proportion de population.
Nous pouvons également utiliser le code suivant pour calculer un intervalle de confiance à 95 % pour la moyenne de la population :
#find total sample size n <- length(data) #find number who responded 'Yes' k <- sum(data == 'Y') #find sample proportion p <- k/n #calculate margin of error margin <- qnorm(0.975)*sqrt(p*(1-p)/n) #calculate lower and upper bounds of confidence interval low <- p - margin low [1] 0.3852967 high <- p + margin high [1] 0.8147033
L’intervalle de confiance à 95 % pour la proportion de population est [0,39, 0,81] .
Ressources additionnelles
Comment calculer le résumé de cinq nombres dans R
Comment trouver des intervalles de confiance dans R
Comment tracer un intervalle de confiance dans R