आर में कट() फ़ंक्शन का उपयोग कैसे करें
आर में कट () फ़ंक्शन का उपयोग मानों की एक श्रृंखला को डिब्बे में काटने और प्रत्येक बिन के लिए लेबल निर्दिष्ट करने के लिए किया जा सकता है।
यह फ़ंक्शन निम्नलिखित सिंटैक्स का उपयोग करता है:
कट(x, टूटता है, लेबल = शून्य,…)
सोना:
- x : वेक्टर नाम
- ब्रेक : बनाने के लिए ब्रेक की संख्या या ब्रेक पॉइंट का वेक्टर
- लेबल : परिणामी डिब्बे के लिए लेबल
निम्नलिखित उदाहरण दिखाते हैं कि आर में निम्नलिखित डेटा फ्रेम के साथ विभिन्न परिदृश्यों में इस फ़ंक्शन का उपयोग कैसे करें:
#create data frame
df <- data. frame (player=c('A', 'B', 'C', 'D', 'E', 'F', 'G', 'H', 'I'),
points=c(4, 7, 8, 12, 14, 16, 20, 26, 36))
#view data frame
df
player points
1 to 4
2 B 7
3 C 8
4 D 12
5 E 14
6 F 16
7 G 20
8:26 a.m.
9 I 36
उदाहरण 1: विरामों की संख्या के आधार पर वेक्टर को काटें
निम्नलिखित कोड दिखाता है कि श्रेणी नामक एक नया कॉलम बनाने के लिए कट() फ़ंक्शन का उपयोग कैसे करें जो बिंदुओं के कॉलम को चार समान आकारों के समूहों में काटता है:
#create new column that places each player into four categories based on points
df$category <- cut(df$points, breaks= 4 )
#view updated data frame
df
player points category
1 to 4 (3.97.12]
2 B 7 (3.97.12]
3 C 8 (3.97.12]
4 D 12 (3.97.12]
5 E 14 (12.20]
6 F 16 (12.20]
7 G 20 (12.20]
8:26 a.m. (20.28]
9 I 36 (28.36]
चूँकि हमने breaking=4 निर्दिष्ट किया है, कट() फ़ंक्शन बिंदु कॉलम में मानों को चार समान आकारों के समूहों में विभाजित करता है।
यहां बताया गया है कि कट() फ़ंक्शन ने यह कैसे किया:
- सबसे पहले, उन्होंने अंक कॉलम (36 – 4 = 32) में सबसे बड़े और सबसे छोटे मान के बीच का अंतर पाया।
- फिर वह इस अंतर को 4 से विभाजित करता है (32 / 4 = 8)
- नतीजा यह हुआ कि प्रत्येक 8 की चौड़ाई वाले चार डिब्बे निकले।
नोट : कट() दस्तावेज़ से निम्नलिखित कार्यक्षमता के कारण न्यूनतम अंतराल 4 के बजाय 3.97 है:
जब विरामों को एकल संख्या के रूप में निर्दिष्ट किया जाता है, तो डेटा की सीमा को विरामों के समान-लंबाई वाले हिस्सों में विभाजित किया जाता है, फिर बाहरी सीमाओं को सीमा से 0.1% दूर ले जाया जाता है ताकि यह सुनिश्चित किया जा सके कि आउटलेर्स विराम अंतराल में दोनों के भीतर आते हैं।
उदाहरण 2: विशिष्ट ब्रेकप्वाइंट के आधार पर वेक्टर काटना
निम्नलिखित कोड दिखाता है कि श्रेणी नामक एक नया कॉलम बनाने के लिए कट() फ़ंक्शन का उपयोग कैसे करें जो विशिष्ट ब्रेकप्वाइंट के वेक्टर के आधार पर बिंदुओं के कॉलम को काटता है:
#create new column based on specific break points
df$category <- cut(df$points, breaks=c(0, 10, 15, 20, 40))
#view updated data frame
df
player points category
1 to 4 (0.10]
2 B 7 (0.10]
3 C 8 (0.10]
4 D 12 (10.15]
5 E 14 (10.15]
6 F 16 (15.20]
7 G 20 (15.20]
8:26 a.m. (20.40)
9 I 36 (20.40]
कट() फ़ंक्शन ने प्रत्येक खिलाड़ी को हमारे द्वारा प्रदान किए गए ब्रेकप्वाइंट के विशिष्ट वेक्टर के आधार पर श्रेणियों में वर्गीकृत किया है।
उदाहरण 3: विशिष्ट ब्रेकप्वाइंट और लेबल का उपयोग करके एक वेक्टर को काटें
निम्नलिखित कोड दिखाता है कि श्रेणी नामक एक नया कॉलम बनाने के लिए कट() फ़ंक्शन का उपयोग कैसे करें जो कस्टम लेबल के साथ विशिष्ट ब्रेकप्वाइंट के वेक्टर के आधार पर बिंदुओं के कॉलम को काटता है:
#create new column based on values in points column
df$category <- cut(df$points,
breaks=c(0, 10, 15, 20, 40),
labels=c(' Bad ', ' OK ', ' Good ', ' Great '))
#view updated data frame
df
player points category
1 A 4 Bad
2 B 7 Bad
3 C 8 Bad
4 D 12 OK
5 E 14 OK
6 F 16 Good
7 G 20 Good
8:26 A.M. Great
9 I 36 Great
नया श्रेणी कॉलम प्रत्येक खिलाड़ी को अंक कॉलम में संबंधित मान के आधार पर खराब, ठीक, अच्छा या उत्कृष्ट के रूप में रैंक करता है।
ध्यान दें : निम्न त्रुटि से बचने के लिए लेबल की संख्या हमेशा ब्रेकप्वाइंट की संख्या से एक कम होनी चाहिए:
Error in cut.default(df$points, breaks = c(0, 10, 15, 20, 40), labels = c("Bad",:
lengths of 'breaks' and 'labels' differ
अतिरिक्त संसाधन
निम्नलिखित ट्यूटोरियल बताते हैं कि R में अन्य सामान्य फ़ंक्शंस का उपयोग कैसे करें:
आर में टेबलेट() फ़ंक्शन का उपयोग कैसे करें
आर में स्प्लिट() फ़ंक्शन का उपयोग कैसे करें
आर में मैच() फ़ंक्शन का उपयोग कैसे करें
आर में रिप्लिकेट() फ़ंक्शन का उपयोग कैसे करें