Teorema limit pusat: definisi + contoh
Teorema limit pusat menyatakan bahwa distribusi sampling dari mean sampel mendekati normal jika ukuran sampel cukup besar, meskipun distribusi populasi tidak normal .
Teorema limit pusat juga menyatakan bahwa distribusi sampling akan mempunyai sifat-sifat sebagai berikut:
1. Rata-rata distribusi sampling akan sama dengan rata-rata distribusi populasi:
x = μ
2. Varians distribusi sampling akan sama dengan varians distribusi populasi dibagi jumlah sampel:
s2 = σ2 /n
Contoh Teorema Limit Pusat
Berikut beberapa contoh untuk mengilustrasikan teorema limit pusat dalam praktiknya.
Distribusi seragam
Misalkan lebar cangkang penyu mengikuti distribusi seragam dengan lebar minimal 2 inci dan lebar maksimal 6 inci. Artinya, jika kita memilih kura-kura secara acak dan mengukur lebar cangkangnya, kemungkinan lebar cangkangnya juga antara 2 dan 6 inci .
Jika kita membuat histogram untuk merepresentasikan sebaran lebar cangkang penyu, maka akan terlihat seperti ini:
Rata-rata distribusi seragam adalah μ = (b+a) / 2 dengan b adalah nilai terbesar yang mungkin dan a adalah nilai terkecil yang mungkin. Dalam hal ini adalah (6+2) / 2 = 4.
Varians dari distribusi seragam adalah σ2 = (ba) 2/12 . Dalam hal ini adalah (6-2) 2/12 = 1,33
Mengambil sampel secara acak sebanyak 2 buah dari distribusi seragam
Sekarang bayangkan kita mengambil sampel acak 2 ekor penyu dari populasi ini dan mengukur lebar cangkang masing-masing penyu. Anggaplah cangkang kura-kura pertama lebarnya 3 inci dan lebar cangkang kura-kura kedua 6 inci. Lebar rata-rata sampel 2 ekor penyu ini adalah 4,5 inci.
Selanjutnya, bayangkan kita mengambil sampel acak lain yang terdiri dari 2 ekor penyu dari populasi ini dan mengukur kembali lebar cangkang masing-masing penyu. Misalkan cangkang kura-kura pertama lebarnya 2,5 inci dan cangkang kura-kura kedua juga lebarnya 2,5 inci. Lebar rata-rata sampel 2 ekor penyu ini adalah 2,5 inci.
Bayangkan kita terus-menerus mengambil sampel acak dari 2 ekor penyu dan terus mencari rata-rata lebar cangkang setiap kali.
Jika kita membuat histogram untuk mewakili rata-rata lebar cangkang seluruh sampel dari 2 ekor penyu, maka akan terlihat seperti ini:
Hal ini disebut distribusi sampling untuk mean sampel karena menunjukkan distribusi mean sampel.
Rata-rata distribusi sampling ini adalah x = μ = 4
Varians dari distribusi sampling ini adalah s2 = σ2 / n = 1,33 / 2 = 0,665
Pengambilan sampel secara acak sebanyak 5 buah dari distribusi seragam
Sekarang bayangkan kita mengulangi percobaan yang sama, tapi kali ini kita mengambil sampel acak dari 5 ekor penyu berulang kali dan mencari rata-rata lebar cangkang setiap kali.
Jika kita membuat histogram untuk mewakili rata-rata lebar cangkang dari semua sampel 5 ekor penyu tersebut, maka akan terlihat seperti ini:
Perhatikan bahwa distribusi ini lebih berbentuk “lonceng” yang menyerupai distribusi normal . Hal ini karena ketika kita mengambil sampel sebesar 5, variansi antara rata-rata sampel kita jauh lebih rendah, sehingga kecil kemungkinannya kita mendapatkan sampel dengan rata-rata mendekati 2 inci atau 6 inci dan lebih besar kemungkinannya untuk mendapatkan sampel dengan rata-rata mendekati 2 inci atau 6 inci. 6 inci. rata-ratanya lebih dekat dengan rata-rata populasi sebenarnya sebesar 4 inci.
Rata-rata distribusi sampling ini adalah x = μ = 4
Varians dari distribusi sampling ini adalah s2 = σ2 / n = 1,33 / 5 = 0,266
Mengambil sampel secara acak sebanyak 30 dari distribusi seragam
Sekarang bayangkan kita mengulangi percobaan yang sama, namun kali ini kita mengambil sampel acak dari 30 penyu berulang kali dan mencari rata-rata lebar cangkang setiap kali.
Jika kita membuat histogram untuk mewakili rata-rata lebar cangkang dari seluruh sampel 30 penyu tersebut, maka akan terlihat seperti ini:
Perhatikan bahwa distribusi pengambilan sampel ini bahkan lebih berbentuk lonceng dan lebih sempit dibandingkan dua distribusi sebelumnya.
Rata-rata distribusi sampling ini adalah x = μ = 4
Varians dari distribusi sampling ini adalah s2 = σ2 / n = 1,33 / 30 = 0,044
Distribusi chi-kuadrat
Misalkan jumlah hewan peliharaan per keluarga di suatu kota mengikuti distribusi chi-kuadrat dengan tiga derajat kebebasan. Jika kita membuat histogram untuk merepresentasikan sebaran hewan berdasarkan famili, maka akan terlihat seperti ini:
Rata-rata distribusi chi-kuadrat hanyalah jumlah derajat kebebasan (df). Dalam hal ini, μ = 3 .
Varians dari distribusi Chi-kuadrat adalah 2 * df. Dalam hal ini, σ2 = 2 * 3 = 6 .
Mengambil sampel secara acak sebanyak 2
Bayangkan kita mengambil sampel acak 2 keluarga dari populasi ini dan menghitung jumlah hewan peliharaan di setiap keluarga. Misalkan keluarga pertama mempunyai 4 hewan peliharaan dan keluarga kedua memiliki 1 hewan peliharaan. Rata-rata jumlah hewan peliharaan untuk sampel 2 keluarga ini adalah 2,5.
Lalu bayangkan kita mengambil sampel acak lain yang terdiri dari 2 keluarga dari populasi ini dan menghitung lagi jumlah hewan peliharaan di setiap keluarga. Misalkan keluarga pertama mempunyai 6 hewan peliharaan dan keluarga kedua memiliki 4 hewan peliharaan. Rata-rata jumlah hewan peliharaan untuk sampel 2 keluarga ini adalah 5.
Bayangkan kita terus mengambil sampel acak dari 2 keluarga berulang kali dan terus menemukan jumlah rata-rata hewan peliharaan setiap saat.
Jika kita membuat histogram untuk mewakili jumlah rata-rata hewan peliharaan dari semua sampel dari 2 keluarga, maka akan terlihat seperti ini:
Rata-rata distribusi sampling ini adalah x = μ = 3
Varians dari distribusi sampling ini adalah s 2 = σ 2 / n = 6 / 2 = 3
Pengambilan sampel secara acak sebanyak 10 orang
Sekarang bayangkan kita mengulangi percobaan yang sama, namun kali ini kita mengambil sampel acak dari 10 famili berulang kali dan setiap kali mencari jumlah rata-rata hewan per famili.
Jika kita membuat histogram untuk mewakili jumlah rata-rata hewan per famili di seluruh sampel 10 famili tersebut, maka akan terlihat seperti ini:
Rata-rata distribusi sampling ini adalah x = μ = 3
Varians dari distribusi sampling ini adalah s2 = σ2 / n = 6/10 = 0,6
Mengambil sampel secara acak sebanyak 30
Sekarang bayangkan kita mengulangi percobaan yang sama, namun kali ini kita mengambil sampel acak dari 30 keluarga berulang kali dan setiap kali mencari jumlah rata-rata hewan per keluarga.
Jika kita membuat histogram untuk mewakili jumlah rata-rata hewan per famili di seluruh sampel dari 30 famili tersebut, maka akan terlihat seperti ini:
Rata-rata distribusi sampling ini adalah x = μ = 3
Varians dari distribusi sampling ini adalah s2 = σ2 / n = 6/30 = 0,2
Ringkasan
Berikut adalah kesimpulan utama dari dua contoh ini:
- Distribusi pengambilan sampel dari rata-rata sampel mendekati normal jika ukuran sampelnya cukup besar, meskipun distribusi populasinya tidak normal . Dalam dua contoh di atas, baik distribusi seragam maupun distribusi chi-kuadrat tidak normal (tidak berbentuk lonceng sama sekali), namun ketika kita mengambil sampel yang cukup besar, distribusi mean sampel berubah menjadi tampak bersikap biasa saja.
- Semakin besar ukuran sampel, semakin rendah varians mean sampelnya.
Definisikan “cukup besar”
Ingatlah bahwa teorema limit pusat menyatakan bahwa distribusi sampling rata-rata sampel mendekati normal jika ukuran sampel “cukup besar” , meskipun distribusi populasi tidak normal.
Tidak ada definisi pasti tentang seberapa besar suatu sampel agar teorema limit pusat dapat diterapkan, namun secara umum hal ini bergantung pada kecondongan distribusi populasi tempat sampel tersebut berasal:
- Jika distribusi populasi simetris, ukuran sampel sekecil 15 terkadang sudah cukup.
- Jika distribusi populasi tidak seimbang, biasanya diperlukan sampel minimal 30 orang.
- Jika distribusi populasi sangat tidak seimbang, mungkin diperlukan sampel sebanyak 40 orang atau lebih.
Lihat tutorial tentangMengondisikan Sampel Besar untuk informasi lebih lanjut tentang topik ini.