Dplyr में ntile() फ़ंक्शन का उपयोग कैसे करें (उदाहरण के साथ)


आप इनपुट वेक्टर को n बिन्स में विभाजित करने के लिए R में dplyr पैकेज से ntile() फ़ंक्शन का उपयोग कर सकते हैं।

यह फ़ंक्शन निम्नलिखित मूल सिंटैक्स का उपयोग करता है:

ntile(x, n)

सोना:

  • x : इनपुट वेक्टर
  • n : डिब्बों की संख्या

नोट : बाल्टी का आकार एक तक भिन्न हो सकता है।

निम्नलिखित उदाहरण दिखाते हैं कि व्यवहार में इस फ़ंक्शन का उपयोग कैसे करें।

उदाहरण 1: वेक्टर के साथ ntile() का उपयोग करें

निम्नलिखित कोड दिखाता है कि 11 तत्वों के वेक्टर को 5 अलग-अलग बकेट में विभाजित करने के लिए ntile() फ़ंक्शन का उपयोग कैसे करें:

 library (dplyr)

#createvector
x <- c(1, 3, 4, 6, 7, 8, 10, 13, 19, 22, 23)

#break up vector into 5 buckets
ntile(x, 5)

 [1] 1 1 1 2 2 3 3 4 4 5 5

परिणाम से, हम देख सकते हैं कि मूल वेक्टर के प्रत्येक तत्व को पाँच बाल्टियों में से एक में रखा गया था।

सबसे छोटे मान बकेट 1 को दिए गए हैं जबकि सबसे बड़े मान बकेट 5 को दिए गए हैं।

उदाहरण के लिए:

  • 1, 3 और 4 के सबसे छोटे मान बकेट 1 को दिए गए हैं।
  • सबसे बड़े मान, 22 और 23, बकेट 5 को निर्दिष्ट हैं।

उदाहरण 2: डेटा फ़्रेम के साथ ntile() का उपयोग करना

मान लीजिए कि हमारे पास आर में निम्नलिखित डेटा फ्रेम है जो विभिन्न बास्केटबॉल खिलाड़ियों द्वारा बनाए गए अंक दिखाता है:

 #create data frame
df <- data. frame (player=LETTERS[1:9],
                 points=c(12, 19, 7, 22, 24, 28, 30, 19, 15))

#view data frame
df

  player points
1 to 12
2 B 19
3 C 7
4 D 22
5 E 24
6 F 28
7 G 30
8:19 a.m.
9 I 15

निम्नलिखित कोड दिखाता है कि डेटा फ़्रेम में एक नया कॉलम बनाने के लिए ntile() फ़ंक्शन का उपयोग कैसे करें जो प्रत्येक खिलाड़ी को प्राप्त अंकों के आधार पर तीन बकेट में से एक को असाइन करता है:

 library (dplyr)

#create new column that assigns players into buckets based on points
df$bucket <- ntile(df$points, 3)

#view updated data frame
df

  player points bucket
1 to 12 1
2 B 19 2
3 C 7 1
4 D 22 2
5 E 24 3
6 F 28 3
7 G 30 3
8:19 2
9 I 15 1

नया बकेट कॉलम प्रत्येक खिलाड़ी को 1 और 3 के बीच मान निर्दिष्ट करता है।

सबसे कम अंक वाले खिलाड़ियों को 1 का मान प्राप्त होता है और उच्चतम अंक वाले खिलाड़ियों को 3 का मान प्राप्त होता है।

अतिरिक्त संसाधन

निम्नलिखित ट्यूटोरियल बताते हैं कि R में अन्य सामान्य फ़ंक्शंस का उपयोग कैसे करें:

Dplyr मेंcross() फ़ंक्शन का उपयोग कैसे करें
Dplyr में रीलोकेट() फ़ंक्शन का उपयोग कैसे करें
Dplyr में स्लाइस() फ़ंक्शन का उपयोग कैसे करें

एक टिप्पणी जोड़ने

आपका ईमेल पता प्रकाशित नहीं किया जाएगा. आवश्यक फ़ील्ड चिह्नित हैं *