Değiştirilerek veya değiştirilmeden numune alma
İstatistiklerde sıklıkla belirli araştırma sorularına cevap verebilmek için veri toplamak isteriz.
Örneğin şu sorulara yanıt vermek isteyebiliriz:
1. Cincinnati, Ohio’da ortalama hane geliri nedir?
2. Belirli bir kaplumbağa popülasyonunun ortalama ağırlığı nedir?
3. Belirli bir ilçede yaşayanların yüzde kaçı belirli bir yasayı destekliyor?
Her senaryoda, ölçmek istediğimiz tüm olası bireysel unsurları temsil eden bir nüfus hakkındaki soruyu yanıtlamak istiyoruz.
Bununla birlikte, bir popülasyondaki her bireye ilişkin veri toplamak yerine, genellikle yalnızca popülasyonun bir kısmını temsil eden popülasyonun bir örneğine ilişkin veri topluyoruz.
Numune almanın iki farklı yolu vardır: değiştirilerek numune alınması ve değiştirilmeden numune alınması .
Bu eğitimde, her birinin pratikte nasıl kullanılacağına ilişkin örneklerle birlikte iki yöntem arasındaki fark açıklanmaktadır.
Değiştirme ile numune alma
Şapkalı 5 öğrencinin isminin olduğunu varsayalım:
- Andy
- Carl
- Tyler
- Becca
- Jessica
Yerine gelecek 2 öğrenciden oluşan bir örnek almak istediğimizi varsayalım.
İlk çizimde Tyler’ın adını seçebiliriz. Daha sonra ismini şapkaya geri koyar ve tekrar çizerdik. İkinci çizimde yine Tyler’ın adını seçebiliriz. Yani örneğimiz şöyle olacaktır: {Tyler, Tyler}
Bu, her çizimden sonra seçtiğimiz ismi değiştirdiğimiz için değiştirilerek örnek alma örneğidir.
Değiştirmeyle örnekleme yaptığımızda, örnek öğeler bağımsızdır çünkü bir yazı tura atışının sonucu önceki yazı tura atışından etkilenmez.
Örneğin Tyler isminin seçilme olasılığı ilk çizimde 1/5, ikinci çizimde ise yine 1/5’tir. İlk çekilişin sonucu, ikinci çekilişin sonucunun olasılığını etkilemez.
Değiştirme ile örnekleme, istatistik ve makine öğreniminde aşağıdakiler dahil birçok farklı senaryoda kullanılır:
Bu yöntemlerin her birinde, değiştirme ile örnekleme kullanılır çünkü bu, zaman alıcı ve pahalı olabilen yeni veriler toplamak yerine, modeller oluşturmak için aynı veri setini birden çok kez kullanmamıza olanak tanır.
Değiştirilmeden numune alma
Yine şapkalı 5 öğrencinin isminin olduğunu varsayalım:
- Andy
- Carl
- Tyler
- Becca
- Jessica
Diyelim ki değiştirmeden 2 öğrenciden oluşan bir örnek almak istiyoruz.
İlk çizimde Tyler’ın adını seçebiliriz. O zaman ismini bir kenara bırakırdık. İkinci çizimde Andy ismini seçebildik. Yani örneğimiz şöyle olacaktır: {Tyler, Andy}
Bu, değiştirmeden numune almanın bir örneğidir çünkü her çizimden sonra seçtiğimiz ismi değiştirmeyiz.
Değiştirmeden örnekleme yaptığımızda, örnek öğeler bağımlıdır çünkü bir yazı tura atışının sonucu önceki yazı tura atışından etkilenir.
Örneğin ilk çizimde Tyler ismini seçme olasılığı 1/5, ikinci çizimde Andy ismini seçme olasılığı 1/4’tür. İlk çekilişin sonucu, ikinci çekilişin sonucunun olasılığını etkiler.
Değiştirmeden örnekleme, bir popülasyondan rastgele bir örnek seçmek istediğimizde kullandığımız yöntemdir.
Örneğin Cincinnati, Ohio’da ortalama hane gelirini tahmin etmek istersek toplamda 500.000 farklı hane olabilir.
Yani, 2.000 haneden oluşan rastgele bir örneklem toplamak isteyebiliriz, ancak herhangi bir haneye ait verinin örneklemde iki kez görünmesini istemediğimizden, değiştirmeden örnekleme yaparız.
Başka bir deyişle, bir kez örnekleme dahil etmek üzere belli bir haneyi seçtikten sonra, o haneyi tekrar seçme şansına sahip olmak istemiyoruz.