Analisis univariat atau multivariat: apa bedanya?


Istilah analisis univariat mengacu pada analisis satu variabel. Anda dapat mengingat ini karena awalan “uni” berarti “satu”.

Istilah analisis multivariat mengacu pada analisis lebih dari satu variabel. Anda dapat mengingat ini karena awalan “multi” berarti “lebih dari satu.”

Ada tiga cara umum untuk melakukan analisis univariat :

1. Ringkasan statistik

  • Kita dapat menghitung ukuran tendensi sentral seperti mean atau median suatu variabel.
  • Kita juga dapat menghitung ukuran dispersi seperti standar deviasi suatu variabel.

2. Distribusi frekuensi

  • Kita dapat membuat distribusi frekuensi , yang menggambarkan seberapa sering setiap nilai muncul untuk suatu variabel.

3. Grafik

  • Kita dapat membuat grafik seperti plot kotak, histogram, plot kepadatan, dll. untuk memvisualisasikan distribusi nilai suatu variabel.

Ada dua cara umum untuk melakukan analisis multivariat :

1. Matriks plot sebar

  • Kita dapat membuat matriks scatterplot, yang memungkinkan kita memvisualisasikan hubungan antara setiap kombinasi variabel berpasangan dalam kumpulan data.

2. Algoritma pembelajaran mesin

  • Kita dapat menggunakan algoritme pembelajaran terawasi untuk menyesuaikan model seperti regresi linier berganda yang mengukur hubungan antara beberapa variabel prediktor dan variabel respons.
  • Kita juga dapat menggunakan algoritme pembelajaran tanpa pengawasan seperti analisis komponen utama untuk menemukan struktur dan hubungan antara beberapa variabel dalam kumpulan data secara bersamaan.

Contoh berikut menunjukkan cara melakukan analisis univariat dan multivariat dengan kumpulan data berikut:

Catatan : Jika Anda menganalisis tepat dua variabel, ini disebut analisis bivariat .

Contoh: Cara Melakukan Analisis Univariat

Kita dapat memilih untuk melakukan analisis univariat pada salah satu variabel individual dalam kumpulan data.

Misalnya, kita dapat memilih untuk melakukan analisis univariat pada variabel Ukuran rumah tangga :

Contoh analisis univariat

Kita dapat menghitung ukuran tendensi sentral ukuran rumah tangga berikut ini:

  • Rata-rata (nilai rata-rata): 3,8
  • Median (nilai rata-rata): 4

Nilai-nilai ini memberi kita gambaran di mana letak nilai “sentral”.

Kita juga dapat menghitung ukuran penyebaran berikut:

  • Rentang (perbedaan antara maks dan min): 6
  • Skala interkuartil (distribusi 50% nilai tengah): 2.5
  • Standar deviasi (ukuran rata-rata penyebaran): 1,87

Nilai-nilai ini memberi kita gambaran tentang distribusi nilai variabel ini.

Kita juga dapat membuat tabel distribusi frekuensi berikut untuk meringkas seberapa sering nilai yang berbeda muncul:

Kita juga dapat membuat diagram kotak untuk memvisualisasikan distribusi nilai menurut ukuran rumah tangga:

Alternatifnya, kita dapat membuat histogram untuk memvisualisasikan distribusi nilai:

Dengan menghitung pengukuran dan membuat grafik ini, kita dapat lebih memahami bagaimana nilai-nilai didistribusikan untuk variabel Ukuran Rumah Tangga.

Contoh: Cara Melakukan Analisis Multivariat

Mari kita asumsikan lagi bahwa kita mempunyai kumpulan data yang sama:

Bentuk analisis multivariat sederhana yang dapat kita lakukan pada dataset ini adalah dengan membuat matriks scatterplot , yaitu matriks yang menampilkan scatterplot untuk setiap kombinasi berpasangan variabel numerik dalam dataset.

Kita dapat membuat matriks jenis ini untuk memvisualisasikan secara bersamaan hubungan antara ukuran rumah tangga, pendapatan tahunan, dan jumlah hewan peliharaan.

Sumber : Lihat tutorial ini untuk melihat cara membuat matriks scatterplot di R.

Cara lain untuk melakukan analisis multivariat pada kumpulan data ini adalah dengan menyesuaikan model regresi linier berganda . Misalnya, kita dapat membuat model regresi yang menggunakan ukuran rumah tangga dan jumlah hewan peliharaan untuk memprediksi pendapatan tahunan.

Sumber : Lihat tutorial ini untuk melihat cara melakukan regresi linier berganda di R.

Cara lain untuk melakukan analisis multivariat pada kumpulan data ini adalah dengan melakukan analisis komponen utama , yang memungkinkan kita menemukan struktur dasar dalam kumpulan data.

Sumber : Lihat tutorial ini untuk melihat cara melakukan analisis komponen utama di R.

Kesimpulan

Berikut ringkasan singkat artikel ini:

  • Analisis univariat merupakan analisis terhadap satu variabel.
  • Analisis multivariat adalah analisis lebih dari satu variabel.
  • Ada berbagai cara berbeda untuk melakukan setiap jenis analisis bergantung pada tujuan akhir Anda.
  • Di dunia nyata, kita sering melakukan kedua jenis analisis tersebut pada satu kumpulan data.
  • Analisis univariat memungkinkan kita memahami distribusi nilai suatu variabel, sedangkan analisis multivariat memungkinkan kita memahami hubungan antara beberapa variabel.

Tambahkan komentar

Alamat email Anda tidak akan dipublikasikan. Ruas yang wajib ditandai *