Cara melakukan manova di r


Untuk memahami MANOVA, pertama-tama ada gunanya memahami ANOVA.

ANOVA (analisis varians) digunakan untuk menentukan apakah terdapat perbedaan yang signifikan secara statistik antara rata-rata tiga atau lebih kelompok independen.

Misalnya, kita ingin mengetahui apakah teknik belajar berdampak pada nilai ujian siswa di suatu kelas atau tidak. Kami membagi kelas menjadi tiga kelompok secara acak. Setiap kelompok menggunakan teknik belajar yang berbeda selama sebulan untuk mempersiapkan ujian. Pada akhir bulan, semua siswa mengikuti ujian yang sama.

Untuk mengetahui apakah teknik belajar berdampak pada nilai ujian, kita dapat melakukan ANOVA satu arah, yang akan memberi tahu kita apakah ada perbedaan yang signifikan secara statistik antara nilai rata-rata ketiga kelompok.

Dalam ANOVA kami memiliki variabel respon. Namun, dalam MANOVA (analisis varians multivariat), kami memiliki beberapa variabel respons.

Misalnya, kita ingin mengetahui dampak tingkat pendidikan (yaitu sekolah menengah atas, gelar associate, sarjana, magister, dll.) terhadap pendapatan tahunan dan jumlah utang pelajar. Dalam hal ini, kita mempunyai satu faktor (tingkat pendidikan) dan dua variabel respon (pendapatan tahunan dan utang pelajar), sehingga kita dapat melakukan MANOVA satu arah.

Terkait: Memahami Perbedaan ANOVA, ANCOVA, MANOVA, dan MANCOVA

Cara melakukan MANOVA di R

Dalam contoh berikut, kami akan mengilustrasikan cara melakukan MANOVA satu arah di R menggunakan kumpulan data iris bawaan, yang berisi informasi tentang panjang dan lebar pengukuran bunga berbeda untuk tiga spesies berbeda (“setosa”, “virginica” , “versiwarna”):

 #view first six rows of iris dataset
head(iris)

# Sepal.Length Sepal.Width Petal.Length Petal.Width Species
#1 5.1 3.5 1.4 0.2 setosa
#2 4.9 3.0 1.4 0.2 setosa
#3 4.7 3.2 1.3 0.2 setosa
#4 4.6 3.1 1.5 0.2 setosa
#5 5.0 3.6 1.4 0.2 setosa
#6 5.4 3.9 1.7 0.4 setosa

Misalkan kita ingin mengetahui apakah spesies mempunyai pengaruh terhadap panjang dan lebar sepal. Dengan menggunakan spesies sebagai variabel bebas, dan panjang serta lebar sepal sebagai variabel respons, kita dapat melakukan MANOVA satu arah menggunakan fungsi manova() di R.

Fungsi manova() menggunakan sintaks berikut:

manova (cbind (rv1, rv2, …) ~ iv, data)

Emas:

  • rv1, rv2 : variabel respon 1, variabel respon 2, dst.
  • iv : variabel bebas
  • data : nama bingkai data

Dalam contoh kita dengan kumpulan data iris, kita dapat memasang MANOVA dan menampilkan hasilnya menggunakan sintaks berikut:

 #fit the MANOVA model
model <- manova(cbind(Sepal.Length, Sepal.Width) ~ Species, data = iris)

#view the results
summary(model)
# Df Pillai approx F num Df den Df Pr(>F)    
#Species 2 0.94531 65.878 4,294 < 2.2e-16 ***
#Residuals 147                                             
#---
#Significant. codes: 0 '***' 0.001 '**' 0.01 '*' 0.05 '.' 0.1 ' ' 1

Dari hasilnya, kita dapat melihat bahwa statistik F adalah 65,878 dan nilai p yang sesuai sangat kecil. Hal ini menunjukkan bahwa terdapat perbedaan yang signifikan secara statistik dalam pengukuran sepal tergantung pada spesiesnya.

Catatan teknis: Secara default, manova() menggunakan statistik uji Pillai . Karena distribusi statistik uji ini rumit, nilai perkiraan F juga disediakan untuk memudahkan interpretasi.

Selain itu, dimungkinkan untuk menentukan ‘Roy’, ‘Hotelling-Lawley’ atau ‘Wilks’ sebagai statistik pengujian untuk digunakan menggunakan sintaks berikut: ringkasan(model, test = ‘Wilks’)

Untuk mengetahui secara pasti bagaimana panjang dan lebar sepal dipengaruhi oleh spesies , kita dapat melakukan ANOVA univariat menggunakan ringkasan.aov() seperti yang ditunjukkan pada kode berikut:

 summary.aov(model)


# Response Sepal.Length:
# Df Sum Sq Mean Sq F value Pr(>F)    
#Species 2 63.212 31.606 119.26 < 2.2e-16 ***
#Residuals 147 38.956 0.265                      
#---
#Significant. codes: 0 '***' 0.001 '**' 0.01 '*' 0.05 '.' 0.1 ' ' 1

# Response Sepal.Width:
# Df Sum Sq Mean Sq F value Pr(>F)    
#Species 2 11.345 5.6725 49.16 < 2.2e-16 ***
#Residuals 147 16.962 0.1154                      
#---
#Significant. codes: 0 '***' 0.001 '**' 0.01 '*' 0.05 '.' 0.1 ' ' 1

Kita dapat melihat dari hasil bahwa nilai p untuk kedua ANOVA univariat sangat rendah (<2.2e-16), menunjukkan bahwa spesies memiliki pengaruh yang signifikan secara statistik terhadap lebar dan panjang sepal .

Visualisasikan sumber daya grup

Mungkin juga berguna untuk memvisualisasikan rata-rata kelompok untuk setiap tingkat spesies variabel independen untuk lebih memahami hasil kami.

Misalnya, kita dapat menggunakan perpustakaan gplots dan fungsi plotmeans() untuk memvisualisasikan rata-rata panjang sepal berdasarkan spesies :

 #load gplots library
library(gplots)

#visualize mean sepal length by species
plotmeans(iris$Sepal.Length ~ iris$Species)

Dari grafik tersebut terlihat bahwa rata-rata panjang sepal sangat bervariasi antar spesies. Hal ini cocok dengan hasil MANOVA kami, yang memberi tahu kami bahwa terdapat perbedaan signifikan secara statistik dalam pengukuran sepal antar spesies.

Kita juga dapat memvisualisasikan lebar rata-rata sepal berdasarkan spesies :

 plotmeans(iris$Sepal.Width ~ iris$Species)

Lihat dokumentasi lengkap untuk fungsi manova() di sini .

Tambahkan komentar

Alamat email Anda tidak akan dipublikasikan. Ruas yang wajib ditandai *