Panduan lengkap: cara menafsirkan hasil anova di r


ANOVA satu arah digunakan untuk menentukan apakah terdapat perbedaan yang signifikan secara statistik antara rata-rata tiga atau lebih kelompok independen.

Tutorial ini memberikan panduan lengkap tentang cara menginterpretasikan hasil ANOVA satu arah di R.

Langkah 1: Buat datanya

Misalkan kita ingin menentukan apakah tiga program pelatihan yang berbeda menghasilkan rata-rata penurunan berat badan yang berbeda pada setiap individu.

Untuk mengujinya, kami merekrut 90 orang untuk berpartisipasi dalam eksperimen yang secara acak kami menugaskan 30 orang untuk mengikuti Program A, Program B, atau Program C selama sebulan.

Kode berikut membuat bingkai data yang akan kita gunakan:

 #make this example reproducible
set. seeds (0)

#create data frame
data <- data. frame (program = rep(c(' A ', ' B ', ' C '), each = 30),
                   weight_loss = c(runif(30, 0, 3),
                                   runif(30, 0, 5),
                                   runif(30, 1, 7)))

#view first six rows of data frame
head(data)

program weight_loss
1 A 2.6900916
2 A 0.7965260
3 A 1.1163717
4 A 1.7185601
5 A 2.7246234
6 A 0.6050458

Langkah 2: Lakukan ANOVA

Selanjutnya, kita akan menggunakan perintah aov() untuk melakukan ANOVA satu arah:

 #fit one-way ANOVA model
model <- aov(weight_loss ~ program, data = data)

Langkah 3: Interpretasikan hasil ANOVA

Selanjutnya, kita akan menggunakan perintah ringkasan() untuk menampilkan hasil ANOVA satu arah:

 #view summary of one-way ANOVA model
summary(model)

            Df Sum Sq Mean Sq F value Pr(>F)    
program 2 98.93 49.46 30.83 7.55e-11 ***
Residuals 87 139.57 1.60                     
---
Significant. codes: 0 '***' 0.001 '**' 0.01 '*' 0.05 '.' 0.1 ' ' 1

Berikut cara menginterpretasikan setiap nilai hasil:

Program Df: Derajat kebebasan variabel program . Ini dihitung sebagai #grup -1. Dalam hal ini terdapat 3 program latihan yang berbeda, sehingga nilainya adalah: 3-1 = 2 .

Df Residuals: Derajat kebebasan residu. Ini dihitung sebagai #total observasi – #kelompok. Dalam hal ini terdapat 90 observasi dan 3 kelompok, sehingga nilainya adalah: 90 -3 = 87 .

Program Sum Sq: Jumlah kuadrat yang terkait dengan variabel program . Nilai ini adalah 98,93 .

Jumlah sisa kuadrat: jumlah kuadrat yang terkait dengan sisa atau “kesalahan”. Nilai ini adalah 139,57 .

Kotak sedang. Program: Jumlah rata-rata kuadrat yang terkait dengan program. Ini dihitung sebagai jumlah kuadrat. program/program Df. Dalam hal ini, dihitung sebagai: 98.93 / 2 = 49.46 .

Kotak sedang. Residual: jumlah rata-rata kuadrat yang terkait dengan residu. Ini dihitung sebagai jumlah kuadrat. residu/residu Df. Dalam hal ini dihitung sebagai berikut: 139.57 / 87 = 1.60 .

Nilai F : Statistik F keseluruhan model ANOVA. Ini dihitung sebagai kuadrat rata-rata. program / Mean kuadrat. Residu. Dalam hal ini dihitung sebagai berikut: 49.46 / 1.60 = 30.83 .

Pr(>F): Nilai p yang terkait dengan statistik F dengan pembilang df = 2 dan penyebut df = 87. Dalam hal ini, nilai p adalah 7.552e-11 , yang merupakan angka yang sangat kecil.

Nilai yang paling penting dalam kumpulan hasil adalah nilai p, karena nilai ini memberi tahu kita jika terdapat perbedaan yang signifikan dalam nilai rata-rata antara ketiga kelompok.

Ingatlah bahwa ANOVA satu arah menggunakan hipotesis nol dan hipotesis alternatif berikut:

  • H 0 (hipotesis nol): semua mean kelompok adalah sama.
  • H A (hipotesis alternatif): Setidaknya rata-rata satu kelompok berbeda dari yang lain.

Karena nilai p dalam tabel ANOVA kami (0,7552e-11) kurang dari 0,05, kami memiliki cukup bukti untuk menolak hipotesis nol.

Artinya, kami memiliki cukup bukti untuk mengatakan bahwa rata-rata penurunan berat badan yang dialami individu tidak sama antara ketiga program pelatihan.

Langkah 4: Lakukan Pengujian Post-Hoc (Jika Perlu)

Jika nilai p pada keluaran ANOVA kurang dari 0,05, kami menolak hipotesis nol. Hal ini menunjukkan bahwa nilai rata-rata antar masing-masing kelompok tidak sama. Namun, hal ini tidak memberi tahu kita kelompok mana yang berbeda satu sama lain.

Untuk mengetahuinya, kita perlu melakukan tes post hoc . Di R, kita bisa menggunakan fungsi TukeyHSD() untuk melakukan ini:

 #perform Tukey post-hoc test
TukeyHSD(model)

$program
         diff lwr upr p adj
BA 0.9777414 0.1979466 1.757536 0.0100545
CA 2.5454024 1.7656076 3.325197 0.0000000
CB 1.5676610 0.7878662 2.347456 0.0000199

Berikut cara menafsirkan hasilnya:

  • Nilai p yang disesuaikan untuk perbedaan rata-rata antara kelompok A dan B adalah 0,0100545 .
  • Nilai p yang disesuaikan untuk perbedaan rata-rata antara kelompok A dan C adalah 0,0000000 .
  • Nilai p yang disesuaikan untuk perbedaan rata-rata antara kelompok B dan C adalah 0,0000199 .

Karena masing-masing nilai p yang disesuaikan kurang dari 0,05, kita dapat menyimpulkan bahwa terdapat perbedaan rata-rata penurunan berat badan yang signifikan antara masing-masing kelompok.

Sumber daya tambahan

Pengantar ANOVA Satu Arah
Bagaimana cara memeriksa asumsi ANOVA
Cara melakukan ANOVA satu arah secara manual
Kalkulator ANOVA satu arah

Tambahkan komentar

Alamat email Anda tidak akan dipublikasikan. Ruas yang wajib ditandai *