Comment générer une distribution normale dans R (avec exemples)
Vous pouvez générer rapidement unedistribution normale dans R en utilisant la fonction rnorm() , qui utilise la syntaxe suivante :
rnorm(n, mean=0, sd=1)
où:
- n : Nombre d’observations.
- moyenne : moyenne de la distribution normale. La valeur par défaut est 0.
- sd : écart type de la distribution normale. La valeur par défaut est 1.
Ce didacticiel montre un exemple d’utilisation de cette fonction pour générer une distribution normale dans R.
Connexe : Un guide sur dnorm, pnorm, qnorm et rnorm dans R
Exemple : générer une distribution normale dans R
Le code suivant montre comment générer une distribution normale dans R :
#make this example reproducible set.seed(1) #generate sample of 200 obs. that follows normal dist. with mean=10 and sd=3 data <- rnorm(200, mean=10, sd=3) #view first 6 observations in sample head(data) [1] 8.120639 10.550930 7.493114 14.785842 10.988523 7.538595
On peut trouver rapidement la moyenne et l’écart type de cette distribution :
#find mean of sample
mean(data)
[1] 10.10662
#find standard deviation of sample
sd(data)
[1] 2.787292
Nous pouvons également créer un histogramme rapide pour visualiser la distribution des valeurs des données :
hist(data, col='steelblue')
Nous pouvons même effectuer un test de Shapiro-Wilk pour voir si l’ensemble de données provient d’une population normale :
shapiro.test(data)
Shapiro-Wilk normality test
data: data
W = 0.99274, p-value = 0.4272
La valeur p du test s’avère être de 0,4272 . Puisque cette valeur n’est pas inférieure à 0,05, nous pouvons supposer que les données de l’échantillon proviennent d’une population normalement distribuée.
Ce résultat ne devrait pas être surprenant puisque nous avons généré les données à l’aide de la fonction rnorm() , qui génère naturellement un échantillon aléatoire de données provenant d’une distribution normale.
Ressources additionnelles
Comment tracer une distribution normale dans R
Un guide sur dnorm, pnorm, qnorm et rnorm dans R
Comment effectuer un test de Shapiro-Wilk pour la normalité dans R