Dplyr का उपयोग करके r में यादृच्छिक रेखाओं का चयन कैसे करें
आप dplyr पैकेज में फ़ंक्शंस का उपयोग करके R में डेटा फ़्रेम में यादृच्छिक पंक्तियों का चयन करने के लिए निम्नलिखित विधियों का उपयोग कर सकते हैं:
विधि 1: पंक्तियों की यादृच्छिक संख्या का चयन करें
df %>% sample_n( 5 )
यह फ़ंक्शन डेटा फ़्रेम से यादृच्छिक रूप से 5 पंक्तियों का चयन करता है।
विधि 2: पंक्तियों का एक यादृच्छिक अंश चुनें
df %>% sample_frac( .25 )
यह फ़ंक्शन डेटा फ़्रेम में सभी पंक्तियों का 25% यादृच्छिक रूप से चुनता है।
निम्नलिखित उदाहरण दिखाते हैं कि आर में निम्नलिखित डेटा फ्रेम के साथ व्यवहार में प्रत्येक विधि का उपयोग कैसे करें:
#create data frame
df <- data. frame (team=c('A', 'B', 'C', 'D', 'E', 'F', 'G', 'H'),
points=c(10, 10, 8, 6, 15, 15, 12, 12),
rebounds=c(8, 8, 4, 3, 10, 11, 7, 7))
#view data frame
df
team points rebounds
1 to 10 8
2 B 10 8
3 C 8 4
4 D 6 3
5 E 15 10
6 F 15 11
7 G 12 7
8:12 a.m. 7
उदाहरण 1: पंक्तियों की यादृच्छिक संख्या का चयन करें
हम डेटा फ़्रेम से 5 पंक्तियों को यादृच्छिक रूप से चुनने के लिए निम्नलिखित कोड का उपयोग कर सकते हैं:
library (dplyr)
#randomly select 5 rows from data frame
df %>% sample_n( 5 )
team points rebounds
1 F 15 11
2 to 10 8
3 D 6 3
4 G 12 7
5 B 10 8
ध्यान दें कि डेटा फ़्रेम से पांच पंक्तियों को यादृच्छिक रूप से चुना गया है।
उदाहरण 2: पंक्तियों का एक यादृच्छिक अंश चुनें
हम डेटा फ़्रेम में सभी पंक्तियों में से 25% को यादृच्छिक रूप से चुनने के लिए निम्नलिखित कोड का उपयोग कर सकते हैं:
library (dplyr)
#randomly select 25% of all rows from data frame
df %>% sample_frac( .25 )
team points rebounds
1 E 15 10
2 G 12 7
चूँकि मूल डेटा फ़्रेम में कुल 8 मान थे, 8 का 25% 2 के बराबर है।
इस प्रकार, डेटा फ़्रेम से दो पंक्तियों को यादृच्छिक रूप से चुना जाता है।
नोट : आप यहां dplyr में सैंपल_एन और सैंपल_फ्रैक फ़ंक्शंस का पूरा दस्तावेज़ पा सकते हैं।
अतिरिक्त संसाधन
निम्नलिखित ट्यूटोरियल बताते हैं कि dplyr में अन्य सामान्य ऑपरेशन कैसे करें:
Dplyr का उपयोग करके इंडेक्स द्वारा कॉलम का चयन कैसे करें
dplyr का उपयोग करके समूह द्वारा पहली पंक्ति का चयन कैसे करें
Dplyr का उपयोग करके अनेक स्थितियों के आधार पर फ़िल्टर कैसे करें
Dplyr का उपयोग करके एक निश्चित स्ट्रिंग वाली पंक्तियों को कैसे फ़िल्टर करें