आर में डेटा को समान आकार के समूहों में कैसे विभाजित करें


आप वेक्टर को समान आकार के समूहों में विभाजित करने के लिए R में ggplot2 पैकेज के Cut_number() फ़ंक्शन का उपयोग कर सकते हैं।

यह फ़ंक्शन निम्नलिखित मूल सिंटैक्स का उपयोग करता है:

कट_नंबर(x,n)

सोना:

  • x: विभाजित करने के लिए डिजिटल वेक्टर का नाम
  • n: समूहों की संख्या

निम्नलिखित उदाहरण दिखाता है कि व्यवहार में इस फ़ंक्शन का उपयोग कैसे करें।

उदाहरण: आर में डेटा को समान आकार के समूहों में कैसे विभाजित करें

मान लीजिए कि हमारे पास आर में निम्नलिखित डेटा फ्रेम है जिसमें 12 विभिन्न बास्केटबॉल खिलाड़ियों द्वारा बनाए गए अंकों के बारे में जानकारी है

 #create data frame
df <- data. frame (player=LETTERS[1:12],
                 points=c(1, 2, 2, 2, 4, 5, 7, 9, 12, 14, 15, 22))

#view data frame
df

   player points
1 to 1
2 B 2
3 C 2
4 D 2
5 E 4
6 F 5
7 G 7
8:9 a.m.
9 I 12
10 D 14
11K15
12 L 22

संबंधित: आर में लेटर फ़ंक्शन का उपयोग कैसे करें

हम समूह नामक एक नया कॉलम बनाने के लिए ggplot2 पैकेज से कट_नंबर() फ़ंक्शन का उपयोग कर सकते हैं जो डेटा फ्रेम की प्रत्येक पंक्ति को पॉइंट कॉलम में मान के आधार पर तीन समूहों में से एक में विभाजित करता है:

 library (ggplot2)

#create new column that splits data into three equal sized groups based on points
df$group <- cut_number(df$points, 3)

#view updated data frame
df

   player points group
1 To 1 [1,3.33]
2 B 2 [1,3.33]
3 C 2 [1,3.33]
4 D 2 [1,3.33]
5 E 4 (3.33.10]
6 F 5 (3.33.10]
7 G 7 (3.33.10]
8 A.M. 9 (3.33.10]
9 I 12 (10.22]
10 J 14 (10.22]
11 K 15 (10.22]
12 L 22 (10.22]

12 खिलाड़ियों में से प्रत्येक को अंक कॉलम में दिखाए गए मान के आधार पर तीन समूहों में से एक में रखा गया था।

परिणाम से हम देख सकते हैं कि 3 अलग-अलग समूह हैं:

  • समूह 1: अंकों का मान 1 और 3.33 के बीच है।
  • समूह 2: अंकों का मान 3.33 और 10 के बीच है।
  • समूह 3: अंकों का मान 10 और 22 के बीच है।

हम देख सकते हैं कि प्रत्येक समूह में चार खिलाड़ियों को रखा गया है।

यदि आप चाहते हैं कि समूह कॉलम समूहों को पूर्णांक मानों के रूप में प्रदर्शित करे, तो आप Cut_number() फ़ंक्शन को as.numeric() फ़ंक्शन में लपेट सकते हैं:

 library (ggplot2)

#create new column that splits data into three equal sized groups based on points
df$group <- as. numeric (cut_number(df$points, 3))

#view updated data frame
df

   player points group
1 A 1 1
2 B 2 1
3 C 2 1
4 D 2 1
5 E 4 2
6 F 5 2
7 G 7 2
8:92 a.m.
9 I 12 3
10 D 14 3
11 K 15 3
12 L 22 3

नए समूह कॉलम में अब यह दर्शाने के लिए मान 1, 2, और 3 शामिल हैं कि खिलाड़ी किस समूह से संबंधित है।

पुनः, प्रत्येक समूह में चार खिलाड़ी शामिल हैं।

नोट : बिंदु कॉलम को तीन से अधिक समूहों में विभाजित करने के लिए, बस Cut_number() फ़ंक्शन में 3 को एक अलग संख्या से बदलें।

अतिरिक्त संसाधन

निम्नलिखित ट्यूटोरियल बताते हैं कि आर में अन्य सामान्य कार्य कैसे करें:

आर में डेटा फ़्रेम को कैसे विभाजित करें
आर में डेटा को प्रशिक्षण और परीक्षण सेट में कैसे विभाजित करें
आर में डेटा ग्रुपिंग कैसे करें

एक टिप्पणी जोड़ने

आपका ईमेल पता प्रकाशित नहीं किया जाएगा. आवश्यक फ़ील्ड चिह्नित हैं *