Rata-rata sampel versus rata-rata populasi: apa bedanya?


Seringkali dalam statistik kita ingin menjawab pertanyaan seperti:

  • Berapa rata-rata pendapatan rumah tangga di suatu kota tertentu?
  • Berapa berat rata-rata suatu spesies penyu tertentu?
  • Berapa rata-rata kehadiran pertandingan sepak bola perguruan tinggi?

Dalam setiap skenario, kami ingin menjawab pertanyaan tentang populasi , yang mewakili semua kemungkinan elemen yang ingin kami ukur.

Namun, alih-alih mengumpulkan data setiap individu dalam suatu populasi, kami malah mengumpulkan data sampel dari populasi, yang mewakili sebagian dari total populasi.

Misalnya, kita mungkin ingin mengetahui berat rata-rata suatu spesies penyu tertentu yang memiliki total populasi 800 ekor.

Karena akan memakan waktu lama untuk menemukan dan menimbang setiap penyu dalam suatu populasi, kami mengumpulkan sampel acak sederhana yang terdiri dari 30 penyu dan mengukur beratnya:

Contoh Contoh Rata-rata

Kami kemudian dapat menggunakan berat rata-rata sampel penyu ini untuk memperkirakan berat rata-rata seluruh penyu dalam populasi.

Cara menghitung mean sampel

Rumus untuk menghitung mean sampel, yang sering dilambangkan dengan x , adalah sebagai berikut:

x = Σx saya / n

Emas:

  • Σ: Simbol Yunani canggih yang berarti “jumlah”
  • x i : Nilai observasi ke-i dalam dataset
  • n: Ukuran sampel

Misalnya, kita mengumpulkan sampel 10 ekor penyu dengan berat sebagai berikut (dalam pon):

  • 70, 80, 80, 85, 90, 95, 110, 120, 140, 150

Rata-rata sampel akan dihitung sebagai berikut:

  • x = (70+ 80+80+85+90+95+110+120+140+150) / 10 = 102

Mengapa mean sampel tidak bias

Dalam jargon statistik, kita dapat mengatakan bahwa mean sampel adalah statistik , sedangkan mean populasi adalah parameter .

Berikut perbedaan kedua istilah tersebut:

Statistik adalah angka yang menggambarkan karakteristik tertentu dari suatu sampel.

Parameter adalah angka yang menggambarkan karakteristik suatu populasi.

Parameter adalah nilai yang sebenarnya ingin kita ukur, namun statistik adalah nilai yang kita gunakan untuk memperkirakan nilai parameter karena statistik lebih mudah diperoleh.

Ketika kita menggunakan metode seperti pengambilan sampel acak sederhana untuk memperoleh sampel, kita mengatakan bahwa mean sampel adalah penduga yang tidak bias dari mean populasi.

Dengan kata lain, kita tidak punya alasan untuk percaya bahwa rata-rata sampel akan meremehkan atau melebih-lebihkan rata-rata populasi sebenarnya.

Alasannya adalah ketika kita menggunakan metode seperti simple random sampling, setiap anggota populasi mempunyai peluang yang sama untuk dimasukkan ke dalam sampel, yang berarti bahwa sampel tersebut kemungkinan besar merupakan “versi mini” dari keseluruhan populasi. .

Kita dapat mengatakan bahwa sampel mewakili populasi secara keseluruhan , artinya rata-rata sampel harus merupakan estimasi yang baik atas rata-rata populasi, dengan asumsi ukuran sampel cukup besar.

Tentang penggunaan interval kepercayaan dengan mean sampel

Meskipun mean sampel memberikan estimasi mean populasi yang tidak bias, kemungkinan besar mean tersebut tidak akan sama persis dengan mean populasi.

Misalnya, jika kita ingin menggunakan sampel penyu untuk memperkirakan berat rata-rata suatu populasi penyu, kita dapat memilih sampel berisi penyu berbobot rendah atau mungkin sampel berisi penyu berat.

Untuk menangkap ketidakpastian di sekitar perkiraan rata-rata populasi, kita dapat membuat interval kepercayaan .

Interval kepercayaan adalah rentang nilai yang kemungkinan memuat parameter populasi dengan tingkat kepercayaan tertentu.

Misalnya, kita mungkin mengumpulkan sampel 30 penyu dan menemukan bahwa berat rata-rata sampel tersebut adalah 102 pon. Jika kita membuat interval kepercayaan 95%, kita mungkin menemukan bahwa intervalnya adalah:

Interval kepercayaan 95% = [98,5, 105,5]

Kami menafsirkan hal ini berarti bahwa ada kemungkinan 95% bahwa interval kepercayaan [98,5, 105,5] berisi rata-rata bobot sebenarnya dari populasi penyu.

Interval kepercayaan ini lebih berguna daripada rata-rata sampel sederhana, karena memberikan kita kisaran nilai yang kemungkinan besar berada pada rata-rata populasi sebenarnya.

Sumber daya tambahan

Populasi vs. sampel: apa bedanya?
Statistik vs. parameter: apa bedanya?
Pengantar Interval Keyakinan

Tambahkan komentar

Alamat email Anda tidak akan dipublikasikan. Ruas yang wajib ditandai *