Cara bootstrapping di excel (dengan contoh)
Bootstrapping adalah metode yang dapat digunakan untuk membangun interval kepercayaan suatu statistik ketika ukuran sampelnya kecil dan distribusi dasarnya tidak diketahui.
Proses dasar untuk bootstrap adalah sebagai berikut:
- Ambil k sampel replikasi dengan penggantian dari kumpulan data tertentu.
- Untuk setiap sampel, hitung statistik minat.
- Hal ini memberikan k perkiraan berbeda untuk statistik tertentu, yang kemudian dapat Anda gunakan untuk menghitung interval kepercayaan untuk statistik tersebut.
Contoh langkah demi langkah berikut menunjukkan cara melakukan bootstrap di Excel.
Langkah 1: Masukkan data asli
Pertama, kita akan memasukkan nilai dari kumpulan data:
Langkah 2: Hasilkan contoh bootstrap
Selanjutnya, kita akan menggunakan rumus berikut untuk menghasilkan contoh bootstrap:
=INDEX( $A$2:$A$16 , RANDBETWEEN(1, ROWS( $A$2:$A$16 )),1)
Kita bisa mengetikkan rumus ini di sel D2 untuk memilih nilai secara acak dari kumpulan data asli.
Kita kemudian dapat menyeret rumus ini ke kanan 10 sel untuk menghasilkan sampel bootstrap pertama kita.
Kita kemudian dapat menyeret rumus ini ke lebih dari 300 baris untuk membuat 300 sampel bootstrap:
Catatan : Bootstrap menggunakan pengambilan sampel dengan penggantian , yang berarti bahwa nilai dari kumpulan data asli dapat muncul beberapa kali dalam sampel tertentu.
Langkah 3: Hitung statistik minat untuk setiap sampel
Kemudian kita dapat menghitung statistik minat untuk setiap sampel.
Misalnya, kita dapat menghitung mean, median, deviasi standar, rentang antarkuartil, dll. untuk setiap sampel.
Untuk contoh khusus ini, kami akan menghitung nilai median untuk setiap sampel:
Kita bisa melihat:
- Sampel bootstrap pertama memiliki nilai median 14 .
- Sampel bootstrap kedua memiliki nilai median 16 .
- Sampel bootstrap ketiga memiliki nilai median 13.5 .
Dan seterusnya.
Langkah 4: Hitung interval kepercayaan bootstrap
Terakhir, kita dapat menghitung interval kepercayaan bootstrap 95% untuk median dengan mencari nilai pada persentil 2,5% dan persentil 97,5% di kolom N.
Untuk melakukan ini, kita dapat menggunakan rumus berikut:
=PERCENTILE( N2:N301 , 0.025) =PERCENTILE( N2:N301 , 0.975)
Tangkapan layar berikut menunjukkan cara menggunakan rumus ini dalam praktik:
Dari hasilnya, kita dapat melihat bahwa interval kepercayaan bootstrap 95% untuk nilai median dataset asli adalah [10.475, 19.7625] .
Perhatikan bahwa dalam contoh ini kami memilih untuk menghasilkan 300 sampel bootstrap, masing-masing dengan ukuran sampel n=10, namun Anda dapat menghasilkan sampel bootstrap sebanyak yang Anda inginkan.
Saat menggunakan perangkat lunak statistik, biasanya menghasilkan sampel bootstrap yang kemudian dapat digunakan untuk membuat interval kepercayaan.
Sumber daya tambahan
Tutorial berikut menjelaskan cara melakukan tugas umum lainnya di Excel:
Cara Menghitung Interval Keyakinan di Excel
Cara Menghitung Interval Prediksi di Excel
Cara Menghitung Interval Toleransi di Excel