Comment effectuer une analyse univariée dans R (avec exemples)
Le terme analyse univariée fait référence à l’analyse d’une variable. Vous pouvez vous en souvenir car le préfixe « uni » signifie « un ».
Il existe trois manières courantes d’effectuer une analyse univariée sur une variable :
1. Statistiques récapitulatives – Mesure le centre et la répartition des valeurs.
2. Tableau de fréquence – Décrit la fréquence à laquelle différentes valeurs apparaissent.
3. Graphiques – Utilisé pour visualiser la distribution des valeurs.
Ce didacticiel fournit un exemple de la manière d’effectuer une analyse univariée pour la variable suivante :
#create variable with 15 values
x <- c(1, 1, 2, 3.5, 4, 4, 4, 5, 5, 6.5, 7, 7.4, 8, 13, 14.2)
Statistiques récapitulatives
Nous pouvons utiliser la syntaxe suivante pour calculer diverses statistiques récapitulatives pour notre variable :
#find mean mean(x) [1] 5.706667 #find median median(x) [1] 5 #find range max(x) - min(x) [1] 13.2 #find interquartile range (spread of middle 50% of values) IQR(x) [1] 3.45 #find standard deviation sd(x) [1] 3.858287
Tableau des fréquences
Nous pouvons utiliser la syntaxe suivante pour produire un tableau de fréquence pour notre variable :
#produce frequency table
table(x)
1 2 3.5 4 5 6.5 7 7.4 8 13 14.2
2 1 1 3 2 1 1 1 1 1 1
Cela nous dit que :
- La valeur 1 apparaît 2 fois
- La valeur 2 apparaît 1 fois
- La valeur 3,5 apparaît 1 fois
Et ainsi de suite.
Graphiques
Nous pouvons produire un boxplot en utilisant la syntaxe suivante :
#produce boxplot
boxplot(x)
Nous pouvons produire un histogramme en utilisant la syntaxe suivante :
#produce histogram
hist(x)
Nous pouvons produire une courbe de densité en utilisant la syntaxe suivante :
#produce density curve
plot(density(x))
Chacun de ces graphiques nous offre une manière unique de visualiser la distribution des valeurs de notre variable.
Vous pouvez trouver plus de didacticiels R sur cette page .