Pengambilan sampel dengan penggantian atau tanpa penggantian
Seringkali dalam statistik kita ingin mengumpulkan data sehingga kita dapat menjawab pertanyaan penelitian tertentu.
Misalnya, kita mungkin ingin menjawab pertanyaan berikut:
1. Berapa median pendapatan rumah tangga di Cincinnati, Ohio?
2. Berapa rata-rata berat badan penyu pada suatu populasi tertentu?
3. Berapa persentase penduduk di suatu daerah yang mendukung undang-undang tertentu?
Dalam setiap skenario, kami ingin menjawab pertanyaan tentang populasi , yang mewakili semua kemungkinan elemen yang ingin kami ukur.
Namun, alih-alih mengumpulkan data setiap individu dalam suatu populasi, kami biasanya hanya mengumpulkan data pada sampel populasi, yang mewakili sebagian dari populasi.
Ada dua cara berbeda untuk mengumpulkan sampel: pengambilan sampel dengan penggantian dan pengambilan sampel tanpa penggantian .
Tutorial ini menjelaskan perbedaan kedua metode tersebut beserta contoh cara menggunakannya dalam praktik.
Pengambilan sampel dengan penggantian
Misalkan kita mempunyai nama 5 siswa yang memakai topi:
- andi
- Karel
- Tyler
- becca
- jessica
Misalkan kita ingin mengambil sampel sebanyak 2 orang siswa dengan penggantinya.
Pada gambar pertama, kita mungkin memilih nama Tyler. Kami kemudian akan memasukkan namanya kembali ke dalam topi dan menggambar lagi. Pada gambar kedua, kita mungkin memilih nama Tyler lagi. Jadi sampel kita adalah: {Tyler, Tyler}
Ini adalah contoh memperoleh sampel dengan penggantian karena kami mengganti nama yang kami pilih setelah setiap gambar.
Saat kita mengambil sampel dengan penggantian, elemen sampel bersifat independen karena hasil dari satu pelemparan koin tidak dipengaruhi oleh pelemparan koin sebelumnya.
Misalnya, peluang terambilnya nama Tyler adalah 1/5 pada gambar pertama dan 1/5 lagi pada gambar kedua. Hasil pengundian pertama tidak mempengaruhi kemungkinan hasil pengundian kedua.
Pengambilan sampel dengan penggantian digunakan dalam berbagai skenario dalam statistik dan pembelajaran mesin, termasuk:
- Cat dasar
- Mengantongi
- Pengenalan sederhana untuk meningkatkan pembelajaran mesin
- Pengantar Sederhana tentang Hutan Acak
Dalam masing-masing metode ini, pengambilan sampel dengan penggantian digunakan karena memungkinkan kita menggunakan kumpulan data yang sama beberapa kali untuk membuat model, dibandingkan mengumpulkan data baru, yang dapat memakan waktu dan mahal.
Pengambilan sampel tanpa penggantian
Sekali lagi, misalkan kita mempunyai nama 5 siswa yang memakai topi:
- andi
- Karel
- Tyler
- becca
- jessica
Misalkan kita ingin mengambil sampel sebanyak 2 siswa tanpa pengembalian.
Pada gambar pertama, kita mungkin memilih nama Tyler. Kami kemudian akan mengesampingkan namanya. Pada gambar kedua kita bisa memilih nama Andy. Jadi sampel kita adalah: {Tyler, Andy}
Ini adalah contoh mendapatkan sampel tanpa pengembalian karena kami tidak mengganti nama yang kami pilih setelah setiap gambar.
Ketika kita mengambil sampel tanpa pengembalian, elemen sampelnya bergantung karena hasil dari satu pelemparan koin dipengaruhi oleh pelemparan koin sebelumnya.
Misalnya peluang terambilnya nama Tyler adalah 1/5 pada pengundian pertama dan peluang terambilnya nama Andy adalah 1/4 pada pengundian kedua. Hasil pengundian pertama mempengaruhi kemungkinan hasil pengundian kedua.
Sampling tanpa pengembalian adalah metode yang kita gunakan ketika kita ingin memilih sampel secara acak dari suatu populasi.
Misalnya, jika kita ingin memperkirakan median pendapatan rumah tangga di Cincinnati, Ohio, maka mungkin terdapat total 500.000 rumah tangga yang berbeda.
Jadi, kita mungkin ingin mengumpulkan sampel acak sebanyak 2.000 rumah tangga, namun kita tidak ingin data rumah tangga tertentu muncul dua kali dalam sampel, jadi kita akan mengambil sampel tanpa pengembalian.
Dengan kata lain, setelah kita memilih rumah tangga tertentu untuk dimasukkan ke dalam sampel, kita tidak ingin mempunyai peluang lagi untuk memilih rumah tangga tersebut untuk dimasukkan ke dalam sampel.