Cara melakukan uji-t sampel berpasangan di r


Uji-t sampel berpasangan adalah uji statistik yang membandingkan rata-rata dua sampel ketika setiap observasi dari satu sampel dapat dicocokkan dengan observasi dari sampel lainnya.

Misalnya, kita ingin mengetahui apakah kurikulum tertentu mempunyai dampak yang signifikan terhadap kinerja siswa pada ujian tertentu. Untuk mengujinya, kami meminta 20 siswa dalam satu kelas untuk mengikuti tes awal. Kemudian, masing-masing mahasiswa mengikuti program studi setiap hari selama dua minggu. Kemudian, siswa mengulangi tes dengan kesulitan serupa.

Untuk membandingkan selisih rata-rata nilai pada tes pertama dan kedua, kami menggunakan uji-t berpasangan karena untuk setiap siswa, nilai mereka pada tes pertama dapat dikaitkan dengan nilai mereka pada tes kedua.

Cara melakukan uji t berpasangan

Untuk melakukan uji-t berpasangan, kita dapat menggunakan pendekatan berikut:

Langkah 1: Nyatakan hipotesis nol dan hipotesis alternatif.

H 0 : μ d = 0

H a : μ d ≠ 0 (dua sisi)
H a : μ d > 0 (satu sisi)
H a : μ d < 0 (satu sisi)

di mana μ d adalah perbedaan rata-rata.

Langkah 2: Temukan statistik uji dan nilai p yang sesuai.

Misal a = nilai siswa pada tes pertama dan b = nilai siswa pada tes kedua. Untuk menguji hipotesis nol bahwa perbedaan rata-rata sebenarnya antara nilai tes adalah nol:

  • Hitung selisih setiap pasangan skor (di = b i – a i )
  • Hitung perbedaan rata-rata (d)
  • Hitung simpangan baku selisih s d
  • Hitung statistik t yaitu T = d / (s d / √n)
  • Temukan nilai p yang sesuai untuk statistik-t dengan n-1 derajat kebebasan.

Langkah 3: Tolak atau jangan tolak hipotesis nol, berdasarkan tingkat signifikansinya.

Jika nilai p lebih kecil dari tingkat signifikansi yang dipilih, kami menolak hipotesis nol dan menyimpulkan bahwa terdapat perbedaan yang signifikan secara statistik antara rata-rata kedua kelompok. Jika tidak, kita akan gagal menolak hipotesis nol.

Cara melakukan uji t berpasangan di R

Untuk melakukan uji t berpasangan di R, kita dapat menggunakan fungsi bawaan t.test() dengan sintaks berikut:

t.test (x, y, berpasangan = BENAR, alternatif = “dua sisi”)

  • x,y: dua vektor digital yang ingin kita bandingkan
  • berpasangan: nilai logika yang menentukan bahwa kita ingin menghitung uji-t berpasangan
  • alternatif: hipotesis alternatif. Ini dapat diatur ke “dua sisi” (default), “atas” atau “bawah”.

Contoh berikut mengilustrasikan bagaimana melakukan uji-t berpasangan untuk menentukan apakah terdapat perbedaan yang signifikan dalam nilai rata-rata antara pra-tes dan pasca-tes untuk 20 siswa.

Buat datanya

Pertama, kita akan membuat dataset:

 #create the dataset
data <- data.frame(score = c(85,85, 78, 78, 92, 94, 91, 85, 72, 97,
                             84, 95, 99, 80, 90, 88, 95, 90, 96, 89,
                             84, 88, 88, 90, 92, 93, 91, 85, 80, 93,
                             97, 100, 93, 91, 90, 87, 94, 83, 92, 95),
                   group = c(rep('pre', 20), rep('post', 20)))

#view the dataset
data

#scoregroup
#1 85 pre
#2 85 pre
#3 78 pre
#4 78 pre
#5 92 pre
#6 94 pre
#7 91 pre
#8 85 pre
#9 72 pre
#10 97 pre
#11 84 pre
#12 95 pre
#13 99 pre
#14 80 pre
#15 90 pre
#16 88 pre
#17 95 pre
#18 90 pre
#19 96 pre
#20 89 pre
#21 84 post
#22 88 post
#23 88 post
#24 90 post
#25 92 post
#26 93 post
#27 91 post
#28 85 post
#29 80 post
#30 93 post
#31 97 post
#32 100 posts
#33 93 post
#34 91 post
#35 90 post
#36 87 post
#37 94 post
#38 83 post
#39 92 post
#40 95 post

Visualisasikan perbedaannya

Selanjutnya, kita akan melihat statistik ringkasan dari kedua grup menggunakan fungsi group_by() dan ringkasan () dari perpustakaan dplyr :

 #load dplyr library
library(dplyr)

#find sample size, mean, and standard deviation for each group
data %>%
group_by (group) %>%
  summarize (
    count = n(),
    mean = mean(score),
    sd = sd(score)
  )

# A tibble: 2 x 4
# group count mean sd
#     
#1 post 20 90.3 4.88
#2 pre 20 88.2 7.24

Kita juga dapat membuat plot kotak menggunakan fungsi boxplot() di R untuk menampilkan distribusi skor untuk grup sebelum dan sesudah:

 boxplot (score~group,
  data=data,
  main="Test Scores by Group",
  xlab="Group",
  ylab="Score",
  col="steelblue",
  border="black"
)

Dari ringkasan statistik dan plot kotak, kita dapat melihat bahwa skor rata-rata pada kelompok pasca sedikit lebih tinggi dibandingkan dengan skor rata-rata pada kelompok pra . Kita juga dapat melihat bahwa skor pasca -kelompok memiliki variabilitas yang lebih kecil dibandingkan skor pra- kelompok.

Untuk mengetahui apakah perbedaan rata-rata kedua kelompok ini signifikan secara statistik, kita dapat melakukan uji t berpasangan.

Lakukan uji-t berpasangan

Sebelum melakukan uji t berpasangan, kita perlu memverifikasi bahwa distribusi perbedaan terdistribusi secara normal (atau mendekati normal). Untuk melakukan ini, kita dapat membuat vektor baru yang didefinisikan sebagai selisih antara skor sebelum dan sesudah, dan melakukan uji Shapiro-Wilk untuk mengetahui normalitas pada vektor nilai ini:

 #define new vector for difference between post and pre scores
differences <- with(data, score[group == "post"] - score[group == "pre"])

#perform shapiro-wilk test for normality on this vector of values
shapiro.test(differences)

# Shapiro-Wilk normality test
#
#data: differences
#W = 0.92307, p-value = 0.1135
#

Nilai p dari tes tersebut adalah 0,1135, lebih besar dari alpha = 0,05. Dengan demikian, kami gagal menolak hipotesis nol bahwa data kami terdistribusi normal. Artinya sekarang kita dapat melanjutkan dengan uji t berpasangan.

Kita dapat menggunakan kode berikut untuk melakukan uji-t berpasangan:

 t.test (score~group, data = data, paired = TRUE)

# Paired t-test
#
#data: score by group
#t = 1.588, df = 19, p-value = 0.1288
#alternative hypothesis: true difference in means is not equal to 0
#95 percent confidence interval:
# -0.6837307 4.9837307
#sample estimates:
#mean of the differences 
#2.15 

Dari hasilnya kita dapat melihat bahwa:

  • Statistik uji -t sebesar 1,588 .
  • Nilai p untuk statistik uji ini dengan 19 derajat kebebasan (df) adalah 0,1288 .
  • Interval kepercayaan 95% untuk perbedaan rata-rata adalah (-0,6837, 4,9837) .
  • Perbedaan rata-rata skor kelompok sebelum dan sesudah adalah 2,15 .

Jadi, karena nilai p kita berada di bawah tingkat signifikansi 0,05, kita akan gagal menolak hipotesis nol yang menyatakan bahwa kedua kelompok memiliki arti yang signifikan secara statistik.

Dengan kata lain, kami tidak memiliki cukup bukti untuk mengatakan bahwa skor rata-rata antara kelompok sebelum dan sesudah berbeda secara statistik. Artinya kurikulum tidak berpengaruh signifikan terhadap nilai ujian.

Selain itu, interval kepercayaan 95% kami menunjukkan bahwa kami “95% yakin” bahwa perbedaan rata-rata sebenarnya antara kedua kelompok adalah antara -0,6837 dan 4,9837 .

Karena nilai nol terdapat dalam interval kepercayaan ini, ini berarti bahwa nol sebenarnya merupakan selisih sebenarnya antara skor rata-rata, itulah sebabnya kami gagal menolak hipotesis nol dalam kasus ini.

Tambahkan komentar

Alamat email Anda tidak akan dipublikasikan. Ruas yang wajib ditandai *