Apa yang dianggap sebagai deviasi standar yang baik?
Standar deviasi digunakan untuk mengukur sebaran nilai dalam suatu sampel.
Kita dapat menggunakan rumus berikut untuk menghitung deviasi standar sampel tertentu:
√ Σ( xi – x batang ) 2 / (n-1)
Emas:
- Σ: Simbol yang berarti “jumlah”
- x i : nilai ke-i dari sampel
- x bar : Arti sampel
- n: Ukuran sampel
Semakin tinggi nilai standar deviasi, maka semakin tersebar nilai-nilai tersebut dalam suatu sampel . Sebaliknya, semakin rendah nilai standar deviasinya, maka semakin erat pengelompokannya.
Pertanyaan yang sering ditanyakan siswa adalah: berapa nilai standar deviasi yang dianggap baik?
Jawabannya: Deviasi standar tidak bisa berarti “baik” atau “buruk”, karena deviasi tersebut hanya memberi tahu kita distribusi nilai dalam suatu sampel.
Juga tidak ada angka universal untuk menentukan apakah suatu standar deviasi “tinggi” atau “rendah”. Misalnya, pertimbangkan skenario berikut:
Skenario 1: Seorang agen real estat mengumpulkan data harga untuk 100 rumah di kotanya dan menemukan bahwa deviasi standar harga adalah $12.000.
Skenario 2 : Seorang ekonom mengukur total pajak penghasilan yang dipungut di 50 negara bagian Amerika Serikat dan menemukan bahwa deviasi standar dari total pajak penghasilan yang dipungut adalah $480.000.
Meskipun standar deviasi skenario 2 jauh lebih tinggi daripada standar deviasi skenario 1, unit yang diukur dalam skenario 2 jauh lebih tinggi karena total pajak yang dipungut oleh negara bagian jelas jauh lebih tinggi dibandingkan harga real estate.
Artinya, tidak ada satu angka pun yang dapat kita gunakan untuk menentukan apakah suatu standar deviasi “baik” atau “buruk”, atau bahkan “tinggi” atau “rendah”, karena bergantung pada situasi.
Gunakan koefisien variasi
Salah satu cara untuk menentukan apakah suatu standar deviasi tinggi adalah dengan membandingkannya dengan rata-rata kumpulan data.
Koefisien variasi , sering disingkat CV , adalah cara mengukur penyebaran nilai dalam kumpulan data relatif terhadap mean. Ini dihitung sebagai berikut:
CV = s/ x
Emas:
- s: deviasi standar kumpulan data
- x : rata-rata kumpulan data
Sederhananya, CV adalah rasio deviasi standar terhadap mean.
Semakin tinggi CV, semakin tinggi standar deviasi dari mean. Secara umum, nilai CV yang lebih besar dari 1 seringkali dianggap tinggi.
Misalnya, seorang agen real estat mengumpulkan data harga 100 rumah di kotanya dan menemukan bahwa harga rata-rata adalah $150.000 dan deviasi standar harga adalah $12.000. CV akan dihitung sebagai berikut:
- CV: $12.000 / $150.000 = 0,08
Karena nilai CV ini jauh lebih kecil dari 1, hal ini menunjukkan bahwa standar deviasi datanya cukup rendah.
Sebaliknya, misalkan seorang ekonom mengukur total pajak penghasilan yang dipungut di 50 negara bagian Amerika Serikat dan menemukan bahwa rata-rata sampelnya adalah $400.000 dan deviasi standarnya adalah $480.000. CV akan dihitung sebagai berikut:
- CV: $480.000 / $400.000 = 1,2
Karena nilai CV ini lebih besar dari 1, berarti simpangan baku nilai datanya cukup tinggi.
Membandingkan deviasi standar antar kumpulan data
Kita sering menggunakan deviasi standar untuk mengukur distribusi nilai pada kumpulan data yang berbeda.
Misalnya, seorang profesor memberi siswanya tiga ujian dalam satu semester. Kemudian menghitung deviasi standar skor untuk setiap ujian:
- Contoh simpangan baku hasil ujian 1 : 4.6
- Contoh simpangan baku hasil ujian 2 : 12.4
- Contoh simpangan baku hasil ujian 3 : 2.3
Hal ini memberi tahu profesor bahwa hasil ujian paling tersebar pada ujian 2, sedangkan hasil paling mengelompok pada ujian 3.
Sumber daya tambahan
Standar deviasi dan kesalahan standar: apa bedanya?
Deviasi standar versus rentang antarkuartil: apa bedanya?