आर में डेटा को समान आकार के समूहों में कैसे विभाजित करें
आप वेक्टर को समान आकार के समूहों में विभाजित करने के लिए R में ggplot2 पैकेज के Cut_number() फ़ंक्शन का उपयोग कर सकते हैं।
यह फ़ंक्शन निम्नलिखित मूल सिंटैक्स का उपयोग करता है:
कट_नंबर(x,n)
सोना:
- x: विभाजित करने के लिए डिजिटल वेक्टर का नाम
- n: समूहों की संख्या
निम्नलिखित उदाहरण दिखाता है कि व्यवहार में इस फ़ंक्शन का उपयोग कैसे करें।
उदाहरण: आर में डेटा को समान आकार के समूहों में कैसे विभाजित करें
मान लीजिए कि हमारे पास आर में निम्नलिखित डेटा फ्रेम है जिसमें 12 विभिन्न बास्केटबॉल खिलाड़ियों द्वारा बनाए गए अंकों के बारे में जानकारी है
#create data frame df <- data. frame (player=LETTERS[1:12], points=c(1, 2, 2, 2, 4, 5, 7, 9, 12, 14, 15, 22)) #view data frame df player points 1 to 1 2 B 2 3 C 2 4 D 2 5 E 4 6 F 5 7 G 7 8:9 a.m. 9 I 12 10 D 14 11K15 12 L 22
संबंधित: आर में लेटर फ़ंक्शन का उपयोग कैसे करें
हम समूह नामक एक नया कॉलम बनाने के लिए ggplot2 पैकेज से कट_नंबर() फ़ंक्शन का उपयोग कर सकते हैं जो डेटा फ्रेम की प्रत्येक पंक्ति को पॉइंट कॉलम में मान के आधार पर तीन समूहों में से एक में विभाजित करता है:
library (ggplot2) #create new column that splits data into three equal sized groups based on points df$group <- cut_number(df$points, 3) #view updated data frame df player points group 1 To 1 [1,3.33] 2 B 2 [1,3.33] 3 C 2 [1,3.33] 4 D 2 [1,3.33] 5 E 4 (3.33.10] 6 F 5 (3.33.10] 7 G 7 (3.33.10] 8 A.M. 9 (3.33.10] 9 I 12 (10.22] 10 J 14 (10.22] 11 K 15 (10.22] 12 L 22 (10.22]
12 खिलाड़ियों में से प्रत्येक को अंक कॉलम में दिखाए गए मान के आधार पर तीन समूहों में से एक में रखा गया था।
परिणाम से हम देख सकते हैं कि 3 अलग-अलग समूह हैं:
- समूह 1: अंकों का मान 1 और 3.33 के बीच है।
- समूह 2: अंकों का मान 3.33 और 10 के बीच है।
- समूह 3: अंकों का मान 10 और 22 के बीच है।
हम देख सकते हैं कि प्रत्येक समूह में चार खिलाड़ियों को रखा गया है।
यदि आप चाहते हैं कि समूह कॉलम समूहों को पूर्णांक मानों के रूप में प्रदर्शित करे, तो आप Cut_number() फ़ंक्शन को as.numeric() फ़ंक्शन में लपेट सकते हैं:
library (ggplot2) #create new column that splits data into three equal sized groups based on points df$group <- as. numeric (cut_number(df$points, 3)) #view updated data frame df player points group 1 A 1 1 2 B 2 1 3 C 2 1 4 D 2 1 5 E 4 2 6 F 5 2 7 G 7 2 8:92 a.m. 9 I 12 3 10 D 14 3 11 K 15 3 12 L 22 3
नए समूह कॉलम में अब यह दर्शाने के लिए मान 1, 2, और 3 शामिल हैं कि खिलाड़ी किस समूह से संबंधित है।
पुनः, प्रत्येक समूह में चार खिलाड़ी शामिल हैं।
नोट : बिंदु कॉलम को तीन से अधिक समूहों में विभाजित करने के लिए, बस Cut_number() फ़ंक्शन में 3 को एक अलग संख्या से बदलें।
अतिरिक्त संसाधन
निम्नलिखित ट्यूटोरियल बताते हैं कि आर में अन्य सामान्य कार्य कैसे करें:
आर में डेटा फ़्रेम को कैसे विभाजित करें
आर में डेटा को प्रशिक्षण और परीक्षण सेट में कैसे विभाजित करें
आर में डेटा ग्रुपिंग कैसे करें