Cara melakukan analisis univariat di r (dengan contoh)
Istilah analisis univariat mengacu pada analisis satu variabel. Anda dapat mengingat ini karena awalan “uni” berarti “satu”.
Ada tiga cara umum untuk melakukan analisis univariat pada suatu variabel:
1. Ringkasan Statistik – Mengukur pusat dan distribusi nilai.
2. Tabel Frekuensi – Menjelaskan seberapa sering nilai yang berbeda muncul.
3. Bagan – Digunakan untuk memvisualisasikan distribusi nilai.
Tutorial ini memberikan contoh cara melakukan analisis univariat untuk variabel berikut:
#create variable with 15 values
x <- c(1, 1, 2, 3.5, 4, 4, 4, 5, 5, 6.5, 7, 7.4, 8, 13, 14.2)
Statistik ringkasan
Kita dapat menggunakan sintaks berikut untuk menghitung berbagai ringkasan statistik untuk variabel kita:
#find means mean(x) [1] 5.706667 #find median median(x) [1] 5 #find range max(x) - min(x) [1] 13.2 #find interquartile range (spread of middle 50% of values) IQR(x) [1] 3.45 #find standard deviation sd(x) [1] 3.858287
Tabel frekuensi
Kita dapat menggunakan sintaks berikut untuk menghasilkan tabel frekuensi untuk variabel kita:
#produce frequency table
table(s)
1 2 3.5 4 5 6.5 7 7.4 8 13 14.2
2 1 1 3 2 1 1 1 1 1 1
Ini memberitahu kita bahwa:
- Nilai 1 muncul dua kali
- Nilai 2 muncul 1 kali
- Nilai 3,5 muncul 1 kali
Dan seterusnya.
Grafik
Kita dapat membuat plot kotak menggunakan sintaks berikut:
#produce boxplot
boxplot(x)
Kita dapat menghasilkan histogram menggunakan sintaks berikut:
#produce histogram
hist(x)
Kita dapat menghasilkan kurva kepadatan menggunakan sintaks berikut:
#produce density curve
plot(density(x))
Masing-masing grafik ini memberi kita cara unik untuk memvisualisasikan distribusi nilai variabel kita.
Anda dapat menemukan lebih banyak tutorial R di halaman ini .