R'de rastgele örnekler nasıl seçilir: örneklerle
R’derastgele bir örnek seçmek için aşağıdaki sözdizimini kullanan sample() işlevini kullanabiliriz:
örnek(x, boyut, değiştir=YANLIŞ, prob=BOŞ)
Altın:
- x: aralarından seçim yapılabilecek öğelerin vektörü.
- boyut: örnek boyutu.
- değiştirme: değiştirmeyle numune alınıp alınmayacağı. Varsayılan değer false’tur.
- prob: vektörden elemanları elde etmek için olasılık ağırlıklarının vektörü. Varsayılan NULL’dur.
Bu eğitimde, R’de hem bir vektörden hem de bir veri çerçevesinden rastgele bir örnek seçmek için bu işlevin nasıl kullanılacağı açıklanmaktadır.
Örnek 1: Bir vektörden rastgele örnek
Aşağıdaki kod, bir vektörden rastgele bir örneğin değiştirilmeden nasıl seçileceğini gösterir:
#create vector of data data <- c(1, 3, 5, 6, 7, 8, 10, 11, 12, 14) #select random sample of 5 elements without replacement sample(x=data, size=5) [1] 10 12 5 14 7
Aşağıdaki kod, bir vektörden değiştirilerek rastgele bir örneğin nasıl seçileceğini gösterir:
#create vector of data data <- c(1, 3, 5, 6, 7, 8, 10, 11, 12, 14) #select random sample of 5 elements with replacement sample(x=data, size=5, replace= TRUE ) [1] 12 1 1 6 14
Örnek 2: Bir veri bloğundan rastgele örnek
Aşağıdaki kod, bir veri çerçevesinden rastgele bir örneğin nasıl seçileceğini gösterir:
#create data frame df <- data.frame(x=c(3, 5, 6, 6, 8, 12, 14), y=c(12, 6, 4, 23, 25, 8, 9), z=c(2, 7, 8, 8, 15, 17, 29)) #view data frame df X Y Z 1 3 12 2 2 5 6 7 3 6 4 8 4 6 23 8 5 8 25 15 6 12 8 17 7 14 9 29 #select random sample of three rows from data frame rand_df <- df[ sample ( nrow (df), size= 3 ), ] #display randomly selected rows rand_df X Y Z 4 6 23 8 7 14 9 29 1 3 12 2
İşte bu kod parçasında neler oluyor:
1. R’de bir veri çerçevesinin alt kümesini seçmek için aşağıdaki söz dizimini kullanırız: df[satırlar, sütunlar]
2. Yukarıdaki kodda veri çerçevesinden ve tüm sütunlardan rastgele 3 satırlık bir örnek seçiyoruz.
3. Nihai sonuç, veri çerçevesinin rastgele seçilen 3 satırdan oluşan bir alt kümesidir.
Sample() fonksiyonunu her kullandığımızda, fonksiyon değerleri rastgele seçtiği için R’nin farklı bir örnek seçeceğini unutmamak önemlidir.
Belirli analizlerin sonuçlarını yeniden oluşturmak için set.seed(bir sayı) kullandığınızdan emin olun, böylece sample() işlevi her seferinde aynı rastgele örneği seçer. Örneğin:
#make this example reproducible set.seed(23) #create data frame df <- data.frame(x=c(3, 5, 6, 6, 8, 12, 14), y=c(12, 6, 4, 23, 25, 8, 9), z=c(2, 7, 8, 8, 15, 17, 29)) #select random sample of three rows from data frame rand_df <- df[ sample ( nrow (df), size= 3 ), ] #display randomly selected rows rand_df X Y Z 5 8 25 15 2 5 6 7 6 12 8 17
Yukarıdaki kodu her çalıştırdığınızda, her seferinde veri çerçevesinin aynı 3 satırı seçilecektir.
Ek kaynaklar
R’de Tabakalı Örnekleme (Örneklerle)
R’de Sistematik Örnekleme (Örneklerle)
R’de Küme Örneklemesi: Örneklerle