Apa itu analisis univariat? (definisi & #038; contoh)
Istilah analisis univariat mengacu pada analisis satu variabel. Anda dapat mengingat ini karena awalan “uni” berarti “satu”.
Tujuan analisis univariat adalah untuk memahami distribusi nilai suatu variabel. Anda dapat membandingkan jenis analisis ini dengan yang berikut ini:
- Analisis bivariat : Analisis dua variabel.
- Analisis multivariat: analisis dua variabel atau lebih.
Misalnya, kita memiliki kumpulan data berikut:
Kita mungkin memilih untuk melakukan analisis univariat pada salah satu variabel individual dalam kumpulan data untuk lebih memahami distribusi nilainya.
Misalnya, kita dapat memilih untuk melakukan analisis univariat pada variabel Ukuran rumah tangga :
Ada tiga cara umum untuk melakukan analisis univariat:
1. Ringkasan statistik
Cara paling umum untuk melakukan analisis univariat adalah dengan mendeskripsikan variabel menggunakan ringkasan statistik .
Ada dua jenis statistik ringkasan yang umum:
- Ukuran tendensi sentral : Angka-angka ini menjelaskan letak pusat suatu kumpulan data. Contohnya termasuk mean dan median .
- Ukuran penyebaran : Angka-angka ini menggambarkan distribusi nilai dalam kumpulan data. Contohnya termasuk interval , rentang antarkuartil , deviasi standar, dan varians .
2. Distribusi frekuensi
Cara lain untuk melakukan analisis univariat adalah dengan membuat distribusi frekuensi , yang menggambarkan seberapa sering nilai yang berbeda muncul dalam kumpulan data.
3. Grafik
Cara lain untuk melakukan analisis univariat adalah dengan membuat grafik untuk memvisualisasikan distribusi nilai suatu variabel tertentu.
Contoh umum meliputi:
- plot kotak
- Histogram
- Kurva kepadatan
- Camembert
Contoh berikut menunjukkan cara melakukan setiap jenis analisis univariat menggunakan variabel Ukuran Rumah Tangga dari kumpulan data yang kami sebutkan sebelumnya:
Statistik ringkasan
Kita dapat menghitung ukuran tendensi sentral ukuran rumah tangga berikut ini:
- Rata-rata (nilai rata-rata): 3,8
- Median (nilai rata-rata): 4
Nilai-nilai ini memberi kita gambaran di mana letak nilai “sentral”.
Kita juga dapat menghitung ukuran penyebaran berikut:
- Rentang (perbedaan antara maks dan min): 6
- Skala interkuartil (distribusi 50% nilai tengah): 2.5
- Standar deviasi (ukuran rata-rata penyebaran): 1,87
Nilai-nilai ini memberi kita gambaran tentang distribusi nilai variabel ini.
Distribusi frekuensi
Kita juga dapat membuat tabel distribusi frekuensi berikut untuk meringkas seberapa sering nilai yang berbeda muncul:
Hal ini memungkinkan kita dengan cepat melihat bahwa ukuran rumah tangga yang paling umum adalah 4 orang .
Sumber: Anda dapat menggunakan kalkulator frekuensi ini untuk secara otomatis menghasilkan distribusi frekuensi untuk variabel apa pun.
Grafik
Kita dapat membuat grafik berikut untuk membantu kita memvisualisasikan distribusi nilai ukuran rumah tangga:
1. Plot Kotak
Plot kotak adalah grafik yang menampilkan ringkasan lima digit kumpulan data.
Ringkasan lima angka meliputi:
- Nilai minimum
- Kuartil pertama
- Nilai median
- Kuartil ketiga
- Nilai maksimum
Berikut adalah tampilan diagram kotak untuk variabel Ukuran Rumah Tangga:
Sumber daya: Anda dapat menggunakan generator boxplot ini untuk secara otomatis menghasilkan boxplot untuk variabel apa pun.
2. Histogram
Histogram adalah jenis grafik yang menggunakan batang vertikal untuk menampilkan frekuensi. Jenis bagan ini adalah cara yang berguna untuk memvisualisasikan distribusi nilai dalam kumpulan data.
Berikut tampilan histogram untuk variabel Ukuran Rumah Tangga:
3. Kurva kepadatan
Kurva kepadatan adalah kurva pada grafik yang mewakili sebaran nilai dalam sekumpulan data.
Hal ini sangat berguna untuk memvisualisasikan “bentuk” suatu distribusi, termasuk apakah suatu distribusi memiliki satu atau lebih “puncak” nilai yang sering muncul atau tidak, dan apakah distribusi tersebut condong ke kiri atau ke kanan atau tidak .
Berikut adalah gambaran kurva kepadatan untuk variabel Ukuran Rumah Tangga:
4. Diagram lingkaran
Diagram lingkaran adalah jenis diagram berbentuk lingkaran dan menggunakan irisan untuk mewakili proporsi keseluruhan.
Berikut tampilan diagram lingkaran untuk variabel Ukuran Rumah Tangga:
Bergantung pada tipe datanya, salah satu bagan ini mungkin lebih berguna dibandingkan bagan lainnya untuk memvisualisasikan distribusi nilai.