Como realizar um teste t de amostras pareadas em r


Um teste t de amostras pareadas é um teste estatístico que compara as médias de duas amostras quando cada observação de uma amostra pode ser combinada com uma observação da outra amostra.

Por exemplo, digamos que queremos saber se um determinado currículo tem um impacto significativo no desempenho dos alunos num determinado exame. Para testar isso, pedimos a 20 alunos de uma turma que façam um pré-teste. Em seguida, cada um dos alunos participa do programa de estudos todos os dias durante duas semanas. Em seguida, os alunos refazem um teste de dificuldade semelhante.

Para comparar a diferença entre as notas médias do primeiro e do segundo teste, utilizamos um teste t pareado porque, para cada aluno, sua pontuação no primeiro teste pode ser associada à sua pontuação no segundo teste.

Como realizar um teste t pareado

Para realizar um teste t pareado, podemos usar a seguinte abordagem:

Passo 1: Indique as hipóteses nula e alternativa.

H 0 : μ d = 0

H a : μ d ≠ 0 (bilateral)
H a : μ d > 0 (unilateral)
H a : μ d < 0 (unilateral)

onde μ d é a diferença média.

Etapa 2: Encontre a estatística de teste e o valor p correspondente.

Seja a = nota do aluno na primeira prova e b = nota do aluno na segunda prova. Para testar a hipótese nula de que a verdadeira diferença média entre as pontuações dos testes é zero:

  • Calcule a diferença entre cada par de pontuações (d i = b i – a i )
  • Calcule a diferença média (d)
  • Calcule o desvio padrão das diferenças s d
  • Calcule a estatística t, que é T = d / (s d / √n)
  • Encontre o valor p correspondente para a estatística t com n-1 graus de liberdade.

Passo 3: Rejeite ou não rejeite a hipótese nula, com base no nível de significância.

Se o valor p for menor que o nível de significância escolhido, rejeitamos a hipótese nula e concluímos que existe diferença estatisticamente significativa entre as médias dos dois grupos. Caso contrário, não conseguiremos rejeitar a hipótese nula.

Como realizar um teste t pareado em R

Para realizar um teste t pareado em R, podemos usar a função integrada t.test() com a seguinte sintaxe:

t.test (x, y, paired = TRUE, alternativa = “dois lados”)

  • x,y: os dois vetores digitais que desejamos comparar
  • emparelhado: um valor lógico especificando que queremos calcular um teste t emparelhado
  • alternativa: a hipótese alternativa. Isto pode ser definido como “frente e verso” (padrão), “superior” ou “inferior”.

O exemplo a seguir ilustra como realizar um teste t pareado para determinar se há uma diferença significativa nas pontuações médias entre um pré-teste e um pós-teste para 20 alunos.

Crie os dados

Primeiro, criaremos o conjunto de dados:

 #create the dataset
data <- data.frame(score = c(85,85, 78, 78, 92, 94, 91, 85, 72, 97,
                             84, 95, 99, 80, 90, 88, 95, 90, 96, 89,
                             84, 88, 88, 90, 92, 93, 91, 85, 80, 93,
                             97, 100, 93, 91, 90, 87, 94, 83, 92, 95),
                   group = c(rep('pre', 20), rep('post', 20)))

#view the dataset
data

#scoregroup
#1 85 pre
#2 85 pre
#3 78 pre
#4 78 pre
#5 92 pre
#6 94 pre
#7 91 pre
#8 85 pre
#9 72 pre
#10 97 pre
#11 84 pre
#12 95 pre
#13 99 pre
#14 80 pre
#15 90 pre
#16 88 pre
#17 95 pre
#18 90 pre
#19 96 pre
#20 89 pre
#21 84 post
#22 88 post
#23 88 post
#24 90 post
#25 92 post
#26 93 post
#27 91 post
#28 85 post
#29 80 post
#30 93 post
#31 97 post
#32 100 posts
#33 93 post
#34 91 post
#35 90 post
#36 87 post
#37 94 post
#38 83 post
#39 92 post
#40 95 post

Visualize as diferenças

A seguir, veremos as estatísticas resumidas dos dois grupos usando as funções group_by() e summary () da biblioteca dplyr :

 #load dplyr library
library(dplyr)

#find sample size, mean, and standard deviation for each group
data %>%
group_by (group) %>%
  summarize (
    count = n(),
    mean = mean(score),
    sd = sd(score)
  )

# A tibble: 2 x 4
# group count mean sd
#     
#1 post 20 90.3 4.88
#2 pre 20 88.2 7.24

Também podemos criar boxplots usando a função boxplot() em R para exibir a distribuição de pontuações para os grupos pré e pós:

 boxplot (score~group,
  data=data,
  main="Test Scores by Group",
  xlab="Group",
  ylab="Score",
  col="steelblue",
  border="black"
)

A partir das estatísticas resumidas e dos box plots, podemos ver que a pontuação média no grupo pós é ligeiramente superior à pontuação média no grupo pré . Também podemos ver que as pontuações pós -grupo têm menos variabilidade do que as pontuações pré -grupo.

Para saber se a diferença entre as médias desses dois grupos é estatisticamente significativa, podemos realizar um teste t pareado.

Execute um teste t pareado

Antes de realizar o teste t pareado, precisamos verificar se a distribuição das diferenças é normalmente (ou aproximadamente normalmente) distribuída. Para fazer isso, podemos criar um novo vetor definido como a diferença entre as pontuações pré e pós, e realizar um teste de Shapiro-Wilk para normalidade neste vetor de valores:

 #define new vector for difference between post and pre scores
differences <- with(data, score[group == "post"] - score[group == "pre"])

#perform shapiro-wilk test for normality on this vector of values
shapiro.test(differences)

# Shapiro-Wilk normality test
#
#data: differences
#W = 0.92307, p-value = 0.1135
#

O valor p do teste é 0,1135, que é maior que alfa = 0,05. Assim, não conseguimos rejeitar a hipótese nula de que nossos dados são normalmente distribuídos. Isso significa que agora podemos prosseguir com o teste t pareado.

Podemos usar o seguinte código para realizar um teste t pareado:

 t.test (score~group, data = data, paired = TRUE)

# Paired t-test
#
#data: score by group
#t = 1.588, df = 19, p-value = 0.1288
#alternative hypothesis: true difference in means is not equal to 0
#95 percent confidence interval:
# -0.6837307 4.9837307
#sample estimates:
#mean of the differences 
#2.15 

Pelo resultado podemos ver que:

  • A estatística do teste t é 1,588 .
  • O valor p para esta estatística de teste com 19 graus de liberdade (gl) é 0,1288 .
  • O intervalo de confiança de 95% para a diferença média é (-0,6837, 4,9837) .
  • A diferença média entre as notas do grupo pré e pós é de 2,15 .

Assim, como nosso valor p está abaixo do nosso nível de significância de 0,05, não rejeitaremos a hipótese nula de que os dois grupos possuem médias estatisticamente significativas.

Em outras palavras, não temos evidências suficientes para afirmar que as pontuações médias entre os grupos pré e pós sejam estatisticamente diferentes. Isso significa que o currículo não teve efeito significativo nas pontuações dos testes.

Além disso, nosso intervalo de confiança de 95% indica que estamos “95% confiantes” de que a verdadeira diferença média entre os dois grupos está entre -0,6837 e 4,9837 .

Como o valor zero está contido neste intervalo de confiança, isso significa que zero poderia realmente ser a verdadeira diferença entre as pontuações médias, razão pela qual não conseguimos rejeitar a hipótese nula neste caso.

Add a Comment

O seu endereço de email não será publicado. Campos obrigatórios marcados com *