Anova vs regresi: apa bedanya?


Dua model yang umum digunakan dalam statistik adalah model ANOVA dan regresi.

Kedua jenis model ini memiliki kesamaan sebagai berikut:

  • Variabel respon pada masing-masing model bersifat kontinyu. Contoh variabel kontinu antara lain berat, tinggi badan, panjang, lebar, waktu, umur, dll.

Namun, kedua jenis model ini memiliki perbedaan sebagai berikut:

  • Model ANOVA digunakan ketika variabel prediktor bersifat kategoris. Contoh variabel kategori termasuk tingkat pendidikan, warna mata, status perkawinan, dll.
  • Model regresi digunakan ketika variabel prediktornya kontinu.*

*Model regresi dapat digunakan dengan variabel prediktor kategoris, namun kita perlu membuat variabel dummy untuk menggunakannya.

Contoh berikut menunjukkan kapan harus menggunakan ANOVA atau model regresi dalam praktiknya.

Contoh 1: Model ANOVA Pilihan

Misalkan seorang ahli biologi ingin memahami apakah empat jenis pupuk yang berbeda menghasilkan rata-rata pertumbuhan tanaman yang sama (dalam inci) selama periode satu bulan. Untuk mengujinya, dia menerapkan setiap pupuk pada 20 tanaman dan mencatat pertumbuhan setiap tanaman setelah satu bulan.

Dalam skenario ini, ahli biologi harus menggunakan model ANOVA satu arah untuk menganalisis perbedaan antar pupuk karena terdapat variabel prediktor dan bersifat kategoris.

Dengan kata lain, nilai variabel prediktor dapat diklasifikasikan ke dalam “kategori” berikut:

  • Pupuk 1
  • Pupuk 2
  • Pupuk 3
  • Pupuk 4

ANOVA satu arah akan memberi tahu ahli biologi apakah rata-rata pertumbuhan tanaman sama atau tidak antara empat jenis pupuk yang berbeda.

Contoh 2: Model Regresi Pilihan

Katakanlah seorang agen real estat ingin memahami hubungan antara ukuran luas dan harga real estat. Untuk menganalisis hubungan ini, dia mengumpulkan data luas dan harga 200 rumah di kota tertentu.

Dalam skenario ini, agen real estat sebaiknya menggunakan model regresi linier sederhana untuk menganalisis hubungan antara kedua variabel ini karena variabel prediktor (ukuran luas) bersifat kontinu.

Dengan menggunakan regresi linier sederhana, agen real estat dapat menyesuaikan model regresi berikut:

Harga real estat = β 0 + β 1 (luas persegi)

Nilai β 1 akan mewakili rata-rata perubahan harga rumah yang terkait dengan setiap penambahan kaki persegi.

Hal ini akan memungkinkan agen real estate untuk mengukur hubungan antara ukuran luas dan harga properti.

Contoh 3: Model regresi dengan variabel dummy pilihan

Misalkan seorang agen real estate ingin memahami hubungan antara variabel prediktor “luas persegi” dan “tipe rumah” (keluarga tunggal, apartemen, townhouse) dengan variabel respon harga real estat.

Dalam skenario ini, agen real estate dapat menggunakan regresi linier berganda dengan mengubah “tipe rumah” menjadi variabel dummy karena saat ini merupakan variabel kategori.

Agen real estat kemudian dapat menyesuaikan model regresi linier berganda berikut:

Harga real estat = β 0 + β 1 (luas persegi) + β 2 (keluarga tunggal) + β 3 (apartemen)

Berikut cara kami menafsirkan koefisien model:

  • β 1 : Rata-rata perubahan harga rumah yang terkait dengan penambahan satu kaki persegi.
  • β 2 : Perbedaan harga rata-rata antara rumah keluarga tunggal dan townhouse, dengan asumsi luas persegi tetap konstan.
  • β 3 : Perbedaan harga rata-rata antara rumah keluarga tunggal dan apartemen, dengan asumsi luas permukaan konstan.

Lihat tutorial berikut untuk melihat cara membuat variabel dummy di berbagai perangkat lunak statistik:

Sumber daya tambahan

Tutorial berikut memberikan pengenalan mendalam tentang model ANOVA:

Tutorial berikut memberikan pengenalan mendalam tentang model regresi linier:

Tambahkan komentar

Alamat email Anda tidak akan dipublikasikan. Ruas yang wajib ditandai *