Dplyr kullanarak r'de rastgele çizgiler nasıl seçilir
Dplyr paketindeki işlevleri kullanarak R’deki bir veri çerçevesindeki rastgele satırları seçmek için aşağıdaki yöntemleri kullanabilirsiniz:
Yöntem 1: Rastgele sayıda satır seçin
df %>% sample_n( 5 )
Bu fonksiyon veri çerçevesinden rastgele 5 satır seçer.
Yöntem 2: rastgele bir satır kesri seçin
df %>% sample_frac( .25 )
Bu işlev, veri çerçevesindeki tüm satırların %25’ini rastgele seçer.
Aşağıdaki örnekler, R’deki aşağıdaki veri çerçevesiyle her yöntemin pratikte nasıl kullanılacağını gösterir:
#create data frame
df <- data. frame (team=c('A', 'B', 'C', 'D', 'E', 'F', 'G', 'H'),
points=c(10, 10, 8, 6, 15, 15, 12, 12),
rebounds=c(8, 8, 4, 3, 10, 11, 7, 7))
#view data frame
df
team points rebounds
1 to 10 8
2 B 10 8
3 C 8 4
4 D 6 3
5 E 15 10
6 F 15 11
7 G 12 7
8:12 a.m. 7
Örnek 1: Rastgele sayıda satır seçin
Veri çerçevesinden rastgele 5 satır seçmek için aşağıdaki kodu kullanabiliriz:
library (dplyr)
#randomly select 5 rows from data frame
df %>% sample_n( 5 )
team points rebounds
1 F 15 11
2 to 10 8
3 D 6 3
4 G 12 7
5 B 10 8
Veri çerçevesinden beş satırın rastgele seçildiğini unutmayın.
Örnek 2: rastgele bir satır kesri seçin
Veri çerçevesindeki tüm satırların %25’ini rastgele seçmek için aşağıdaki kodu kullanabiliriz:
library (dplyr)
#randomly select 25% of all rows from data frame
df %>% sample_frac( .25 )
team points rebounds
1 E 15 10
2 G 12 7
Orijinal veri çerçevesinin toplam 8 değeri olduğundan 8’in %25’i 2’ye eşittir.
Böylece veri çerçevesinden rastgele iki satır seçilir.
Not : dplyr’de sample_n ve sample_frac işlevlerinin tam belgelerini burada bulabilirsiniz.
Ek kaynaklar
Aşağıdaki eğitimlerde dplyr’de diğer yaygın işlemlerin nasıl gerçekleştirileceği açıklanmaktadır:
Dplyr kullanarak dizine göre sütunlar nasıl seçilir
Dplyr kullanarak gruba göre ilk satır nasıl seçilir
Dplyr kullanarak birden çok koşula göre filtreleme nasıl yapılır
Belirli bir dizeyi içeren satırları dplyr kullanarak nasıl filtreleyebilirim?