Rentang antarkuartil dan deviasi standar: apa bedanya?
Rentang interkuartil dan deviasi standar adalah dua cara untuk mengukur distribusi nilai dalam suatu kumpulan data.
Tutorial ini memberikan penjelasan singkat masing-masing metrik beserta persamaan dan perbedaan keduanya.
Jarak interkuartil
Rentang interkuartil (IQR) suatu kumpulan data adalah selisih antara kuartil pertama (persentil ke-25) dan kuartil ketiga (persentil ke-75). Ini mengukur distribusi rata-rata 50% nilai.
IQR = Q3 – Q1
Misalnya, kita memiliki kumpulan data berikut:
Kumpulan data: 1, 4, 8, 11, 13, 17, 19, 19, 20, 23, 24, 24, 25, 28, 29, 31, 32
Menurut kalkulator rentang antarkuartil, rentang antarkuartil (IQR) untuk kumpulan data ini dihitung sebagai berikut:
- T1: 12
- T3: 26.5
- IQR = Q3 – Q1 = 14,5
Ini memberitahu kita bahwa 50% tengah dari nilai-nilai dalam kumpulan data memiliki deviasi sebesar 14,5 .
Deviasi standar
Deviasi standar suatu kumpulan data adalah cara untuk mengukur deviasi tipikal nilai individu dari nilai rata-rata. Ini dihitung sebagai berikut:
s = √(Σ( xi – x ) 2 / (n-1))
Misalnya, kita memiliki kumpulan data berikut:
Kumpulan data: 1, 4, 8, 11, 13, 17, 19, 19, 20, 23, 24, 24, 25, 28, 29, 31, 32
Kita dapat menggunakan kalkulator untuk mengetahui bahwa simpangan baku kumpulan data ini adalah 9,25 . Ini memberi kita gambaran seberapa jauh nilai tipikal dari rata-rata.
Persamaan dan perbedaan
Rentang interkuartil dan deviasi standar memiliki kesamaan sebagai berikut:
- Kedua metrik tersebut mengukur distribusi nilai dalam kumpulan data.
Namun, rentang antarkuartil dan deviasi standar memiliki perbedaan utama sebagai berikut:
- Rentang interkuartil (IQR) tidak terpengaruh oleh outlier ekstrim. Misalnya nilai yang sangat kecil atau sangat besar pada suatu dataset tidak akan mempengaruhi perhitungan IQR karena IQR hanya menggunakan nilai persentil ke 25 dan persentil ke 75 dari dataset tersebut.
- Deviasi standar dipengaruhi oleh outlier ekstrim. Misalnya, nilai yang sangat besar dalam kumpulan data akan menghasilkan deviasi standar yang jauh lebih besar karena deviasi standar menggunakan setiap nilai dalam kumpulan data dalam rumusnya.
Kapan menggunakan masing-masing
Anda harus menggunakan rentang interkuartil untuk mengukur distribusi nilai dalam kumpulan data ketika terdapat outlier yang ekstrim.
Sebaliknya, Anda sebaiknya menggunakan deviasi standar untuk mengukur distribusi nilai ketika tidak ada outlier yang ekstrim.
Untuk mengilustrasikan alasannya, pertimbangkan kumpulan data berikut:
Kumpulan data: 1, 4, 8, 11, 13, 17, 19, 19, 20, 23, 24, 24, 25, 28, 29, 31, 32
Sebelumnya di artikel ini, kami menghitung metrik berikut untuk kumpulan data ini:
- IQR: 14,5
- Deviasi standar: 9,25
Namun, pertimbangkan apakah kumpulan data tersebut memiliki outlier yang ekstrim:
Kumpulan data: 1, 4, 8, 11, 13, 17, 19, 19, 20, 23, 24, 24, 25, 28, 29, 31, 32, 378
Kita dapat menggunakan kalkulator untuk menemukan metrik berikut untuk kumpulan data ini:
- IQR: 15
- Deviasi standar: 85,02
Perhatikan bahwa rentang antarkuartil hampir tidak berubah ketika terdapat outlier, sedangkan deviasi standar meningkat dari 9,25 menjadi 85,02.
Sumber daya tambahan
Ukuran tendensi sentral: definisi dan contoh
Ukuran dispersi: definisi dan contoh
Cara mencari outlier menggunakan rentang interkuartil