Kondisi 10% dalam statistik: definisi & contoh
Uji coba Bernoulli adalah eksperimen yang hanya memiliki dua kemungkinan hasil – “berhasil” atau “gagal” – dan probabilitas keberhasilannya sama setiap kali eksperimen dilakukan.
Contoh esai Bernoulli adalah lemparan koin. Koin hanya dapat mendarat pada dua kepala (kita mungkin menyebut kepala sebagai “pukulan” dan ekor sebagai “gagal”) dan probabilitas keberhasilan pada setiap pelemparan adalah 0,5, dengan asumsi koin tersebut adil.
Seringkali dalam statistik, ketika kita ingin menghitung probabilitas yang melibatkan lebih dari beberapa percobaan Bernoulli, kita menggunakan distribusi normal sebagai perkiraan. Namun, untuk melakukan hal ini kita harus berasumsi bahwa uji coba tersebut bersifat independen.
Dalam kasus di mana uji coba tidak benar-benar independen, kita selalu dapat berasumsi bahwa uji coba tersebut independen jika ukuran sampel yang kita gunakan tidak melebihi 10% dari ukuran populasi. Ini disebut kondisi 10% .
Kondisi 10%: Selama ukuran sampel kurang dari atau sama dengan 10% dari ukuran populasi, kita selalu dapat berasumsi bahwa uji Bernoulli bersifat independen.
Intuisi di balik kondisi 10%.
Untuk mengembangkan intuisi di balik kondisi 10%, perhatikan contoh berikut.
Asumsikan proporsi sebenarnya siswa di kelas tertentu yang lebih memilih sepak bola daripada bola basket adalah 50%. Misalkan variabel acak X adalah jumlah siswa yang dipilih secara acak dalam 4 percobaan yang lebih menyukai sepak bola daripada bola basket. Katakanlah kita ingin memahami probabilitas bahwa 4 siswa yang dipilih secara acak lebih memilih sepak bola daripada bola basket.
Jika ukuran kelas kita adalah 20 siswa dan uji coba kita bersifat independen (misalnya, kita dapat mengambil sampel berulang dari seluruh 20 siswa), maka probabilitas setiap siswa lebih memilih sepak bola daripada bola basket dapat dihitung sebagai berikut:
P(Keempat siswa tersebut lebih menyukai sepak bola) = 10/20 * 10/20 * 10/20 * 10/20 = .0625 .
Namun, jika uji coba kami tidak independen (misalnya, setelah kami mengambil sampel seorang siswa, siswa tersebut tidak dapat dikembalikan ke kelas), maka probabilitas bahwa keempat siswa tersebut akan memilih sepak bola akan dihitung sebagai berikut:
P(Keempat siswa tersebut lebih menyukai sepak bola) = 10/20 * 9/19 * 8/18 * 7/17 = .0433 .
Kedua kemungkinan ini sangat berbeda. Misalkan dalam contoh ini, ukuran sampel kita (4 siswa) tidak kurang dari atau sama dengan 10% populasi (20 siswa), sehingga kita tidak dapat menggunakan kondisi 10%.
Namun, perhatikan tabel berikut yang menunjukkan probabilitas bahwa 4 siswa yang dipilih secara acak akan menyukai sepak bola, berdasarkan ukuran kelas:
Ketika ukuran sampel relatif terhadap ukuran populasi (misalnya “ukuran kelas” dalam contoh ini) berkurang, probabilitas yang dihitung antara uji coba independen dan uji coba non-independen semakin dekat.
Perhatikan bahwa ketika ukuran sampel tepat 10% dari ukuran populasi, perbedaan antara probabilitas uji coba independen dan uji non-independen relatif sama.
Dan ketika ukuran sampel jauh lebih kecil dari 10% dari ukuran populasi (misalnya hanya 0,4% dari ukuran populasi pada baris terakhir tabel), probabilitas antara uji coba independen dan non-independen sangatlah dekat.
Kesimpulan
Kondisi 10% menyatakan bahwa ukuran sampel kita harus kurang dari atau sama dengan 10% dari ukuran populasi agar dapat mengasumsikan bahwa serangkaian uji coba Bernoulli bersifat independen.
Tentu saja, yang terbaik adalah ukuran sampel kita berada di bawah 10% dari ukuran populasi sehingga kesimpulan kita tentang populasi tersebut seakurat mungkin. Misalnya, kami lebih memilih ukuran sampel kami hanya 5% dari populasi, bukan 10%.
Sumber daya tambahan
Pengenalan distribusi normal
Pengenalan distribusi binomial
Pengantar Teorema Limit Pusat