Comment effectuer un test T à deux échantillons dans R
Un test t à deux échantillons est utilisé pour tester si les moyennes de deux populations sont égales ou non.
Vous pouvez utiliser la syntaxe de base suivante pour effectuer un test t à deux exemples dans R :
t.test(group1, group2, var.equal=TRUE)
Remarque : En spécifiant var.equal=TRUE , nous disons à R de supposer que les variances sont égales entre les deux échantillons.
Si vous ne souhaitez pas faire cette hypothèse, laissez simplement cet argument de côté et R effectuera à la place le test t de Welch , qui ne suppose pas que les variances sont égales entre les échantillons.
L’exemple suivant montre comment effectuer un test t à deux échantillons dans R en pratique.
Exemple : test T à deux échantillons dans R
Supposons que nous voulions savoir si deux espèces de plantes différentes ont la même hauteur moyenne.
Pour tester cela, nous collectons un échantillon aléatoire simple de 12 plantes de chaque espèce.
Le code suivant montre comment effectuer un test t à deux échantillons dans R pour déterminer si la hauteur moyenne est égale entre les deux espèces :
#create vectors to hold plant heights from each sample group1 <- c(8, 8, 9, 9, 9, 11, 12, 13, 13, 14, 15, 19) group2 <- c(11, 12, 13, 13, 14, 14, 14, 15, 16, 18, 18, 19) #perform two sample t-test t.test(group1, group2, var.equal=TRUE) Two Sample t-test data: group1 and group2 t = -2.5505, df = 22, p-value = 0.01823 alternative hypothesis: true difference in means is not equal to 0 95 percent confidence interval: -5.5904820 -0.5761847 sample estimates: mean of x mean of y 11.66667 14.75000
Voici comment interpréter les résultats du test :
data : les noms des vecteurs qui contiennent les exemples de données.
t : La statistique de test t. Dans ce cas, il s’agit de -2,5505 .
df : Les degrés de liberté, calculés comme n 1 + n 2 – 2 = 12 + 12 – 2 = 22 .
Valeur p : La valeur p qui correspond à une statistique de test de -2,5505 et df = 22. La valeur p s’avère être .01823 . Nous pouvons confirmer cette valeur en utilisant le calculateur T Score to P Value .
Intervalle de confiance de 95 % : intervalle de confiance de 95 % pour la véritable différence de moyenne entre les deux groupes. Il s’avère que c’est [-5.59, -.576] .
estimations d’échantillon : la moyenne de l’échantillon de chaque groupe. Dans ce cas, la moyenne de l’échantillon du groupe 1 était de 11,667 et la moyenne de l’échantillon du groupe 2 était de 14,75 .
Les hypothèses nulles et alternatives pour ce test t à deux échantillons particuliers sont les suivantes :
H 0 : µ 1 = µ 2 (les deux moyennes de population sont égales)
H A : µ 1 ≠µ 2 (les deux moyennes de population ne sont pas égales)
La valeur p de notre test (0,01823) étant inférieure à 0,05, nous rejetons l’hypothèse nulle.
Cela signifie que nous disposons de suffisamment de preuves pour conclure que la hauteur moyenne des plantes entre les deux espèces n’est pas égale.
Notes techniques
La fonction t.test() dans R utilise la syntaxe suivante :
t.test(x, y, alternative="two.sided", mu=0, paired=FALSE, var.equal=FALSE, conf.level=0.95)
où:
- x, y : les noms des deux vecteurs qui contiennent les données.
- alternative : L’hypothèse alternative. Les options incluent « recto verso », « moins » ou « plus grand ».
- mu : La valeur supposée être la vraie différence des moyennes.
- paired : s’il faut ou non utiliser un test t apparié.
- var.equal : si les écarts sont égaux ou non entre les deux groupes.
- conf.level : Le niveau de confiance à utiliser pour le test.
N’hésitez pas à modifier n’importe lequel de ces arguments lorsque vous effectuez votre propre test t, en fonction du test particulier que vous souhaitez effectuer.
Ressources additionnelles
Les didacticiels suivants expliquent comment effectuer d’autres tâches courantes dans R :
Comment effectuer un test T sur un échantillon dans R
Comment effectuer le test T de Welch dans R
Comment effectuer un test T pour échantillons appariés dans R