आर में ड्रॉपलेवल्स फ़ंक्शन का उपयोग कैसे करें (उदाहरण के साथ)


R में ड्रॉपलेवल्स() फ़ंक्शन का उपयोग अप्रयुक्त कारक स्तरों को हटाने के लिए किया जा सकता है।

यह फ़ंक्शन विशेष रूप से उपयोगी है यदि हम उन कारक स्तरों को हटाना चाहते हैं जो अब वेक्टर या डेटा फ़्रेम के सबसेट के कारण उपयोग नहीं किए जाते हैं।

यह फ़ंक्शन निम्नलिखित सिंटैक्स का उपयोग करता है:

गिरावट का स्तर (x)

जहां x एक वस्तु है जिससे अप्रयुक्त कारक स्तरों को हटाया जा सकता है।

यह ट्यूटोरियल व्यवहार में इस सुविधा का उपयोग कैसे करें इसके कुछ उदाहरण प्रदान करता है।

उदाहरण 1: एक वेक्टर में अप्रयुक्त कारक स्तरों को हटा दें

मान लीजिए कि हम पांच कारक स्तरों के साथ एक डेटा वेक्टर बनाते हैं। इसके बाद, मान लीजिए कि हम मूल पांच कारक स्तरों में से केवल तीन के साथ एक नया डेटा वेक्टर परिभाषित करते हैं।

 #define data with 5 factor levels
data <- factor (c(1, 2, 3, 4, 5))

#define new data as original data minus 4th and 5th factor levels
new_data <- data[-c(4, 5)]

#view new data
new_data

[1] 1 2 3
Levels: 1 2 3 4 5

हालाँकि नए डेटा में केवल तीन कारक शामिल हैं, हम देख सकते हैं कि इसमें अभी भी मूल पाँच कारक स्तर शामिल हैं।

इन अप्रयुक्त कारक स्तरों को हटाने के लिए, हम ड्रॉपलेवल्स() फ़ंक्शन का उपयोग कर सकते हैं:

 #drop unused factor levels
new_data < -droplevels (new_data)

#view data
new_data

[1] 1 2 3
Levels: 1 2 3

नए डेटा में अब कारकों के केवल तीन स्तर शामिल हैं।

उदाहरण 2: डेटा फ़्रेम में अप्रयुक्त कारक स्तरों को हटा दें

मान लीजिए कि हम एक डेटा फ्रेम बनाते हैं जिसमें एक वेरिएबल पांच-स्तरीय कारक है। इसके बाद, मान लीजिए कि हम एक नया डेटा फ़्रेम परिभाषित करते हैं जो इनमें से दो कारक स्तरों को हटा देता है:

 #create data frame
df <- data. frame (region= factor (c('A', 'B', 'C', 'D', 'E')),
                 sales = c(13, 16, 22, 27, 34))

#view data frame
df

  regional sales
1 to 13
2 B 16
3 C 22
4 D 27
5 E 34

#define new data frame
new_df <- subset (df, sales < 25)

#view new data frame
new_df

  regional sales
1 to 13
2 B 16
3 C 22

#check levels of region variable
levels (new_df$region)

[1] “A” “B” “C” “D” “E”

हालाँकि नए डेटाबेस में क्षेत्र कॉलम में केवल तीन कारक शामिल हैं, फिर भी इसमें मूल पाँच कारक स्तर शामिल हैं। यदि हम इस डेटा का उपयोग करके प्लॉट बनाने का प्रयास करेंगे तो इससे समस्याएँ पैदा होंगी।

क्षेत्र चर से अप्रयुक्त कारक स्तरों को हटाने के लिए, हम ड्रॉपलेवल्स() फ़ंक्शन का उपयोग कर सकते हैं:

 #drop unused factor levels
new_df$region <- droplevels (new_df$region)

#check levels of region variable
levels (new_df$region)

[1] “A” “B” “C”

अब क्षेत्र चर में कारकों के केवल तीन स्तर होते हैं।

आप इस पृष्ठ पर अधिक आर ट्यूटोरियल पा सकते हैं।

एक टिप्पणी जोड़ने

आपका ईमेल पता प्रकाशित नहीं किया जाएगा. आवश्यक फ़ील्ड चिह्नित हैं *