आर में क्वांटाइल सामान्यीकरण कैसे करें


आंकड़ों में, क्वांटाइल सामान्यीकरण एक ऐसी विधि है जो सांख्यिकीय गुणों के संदर्भ में दो वितरणों को समान बनाती है।

निम्नलिखित उदाहरण दिखाता है कि आर में क्वांटाइल सामान्यीकरण कैसे करें।

उदाहरण: आर में मात्रात्मक सामान्यीकरण

मान लीजिए कि हम R में निम्नलिखित डेटा फ़्रेम बनाते हैं जिसमें दो कॉलम हैं:

 #make this example reproducible
set. seeds (0)

#create data frame with two columns
df <- data. frame (x=rnorm(1000),
                 y=rnorm(1000))

#view first six rows of data frame
head(df)

           xy
1 1.2629543 -0.28685156
2 -0.3262334 1.84110689
3 1.3297993 -0.15676431
4 1.2724293 -1.38980264
5 0.4146414 -1.47310399
6 -1.5399500 -0.06951893

हम x और y की मात्राओं की गणना करने के लिए sapply() और quantile() फ़ंक्शन का उपयोग कर सकते हैं:

 #calculate quantiles for x and y
sapply(df, function(x) quantile(x, probs = seq(0, 1, 1/4)))

               xy
0% -3.23638573 -3.04536393
25% -0.70845589 -0.73331907
50% -0.05887078 -0.03181533
75% 0.68763873 0.71755969
100% 3.26641452 3.03903341

ध्यान दें कि x और y में मात्राओं के लिए समान मान हैं, लेकिन समान मान नहीं हैं।

उदाहरण के लिए, x के लिए 25वां प्रतिशतक मान -0.708 है और y के लिए 25वां प्रतिशतक मान -0.7333 है।

क्वांटाइल सामान्यीकरण करने के लिए, हम आर में प्रीप्रोसेसकोर पैकेज से नॉर्मलाइज़.क्वांटाइल्स () फ़ंक्शन का उपयोग कर सकते हैं:

 library (preprocessCore)

#perform quantile normalization
df_norm <- as. data . frame ( normalize.quantiles ( as.matrix (df)))

#rename data frame columns
names(df_norm) <- c(' x ', ' y ')

#view first six row of new data frame
head(df_norm)

           xy
1 1.2632137 -0.28520228
2 -0.3469744 1.82440519
3 1.3465807 -0.16471644
4 1.2692599 -1.34472394
5 0.4161133 -1.43717759
6 -1.6269731 -0.07906793

फिर हम x और y की मात्राओं की दोबारा गणना करने के लिए निम्नलिखित कोड का उपयोग कर सकते हैं:

 #calculate quantiles for x and y
sapply(df_norm, function(x) quantile(x, probs = seq(0, 1, 1/4)))

               xy
0% -3.14087483 -3.14087483
25% -0.72088748 -0.72088748
50% -0.04534305 -0.04534305
75% 0.70259921 0.70259921
100% 3.15272396 3.15272396

ध्यान दें कि मात्राएँ अब x और y के लिए समान हैं।

हम कहेंगे कि x और y को मात्रात्मक रूप से सामान्यीकृत किया गया है। दूसरे शब्दों में, दोनों वितरण अब सांख्यिकीय गुणों के संदर्भ में समान हैं।

अतिरिक्त संसाधन

निम्नलिखित ट्यूटोरियल बताते हैं कि आर में अन्य सामान्य कार्य कैसे करें:

आर में डेटा को सामान्य कैसे करें
आर में प्रतिशतक की गणना कैसे करें
आर में क्वांटाइल () फ़ंक्शन का उपयोग कैसे करें

एक टिप्पणी जोड़ने

आपका ईमेल पता प्रकाशित नहीं किया जाएगा. आवश्यक फ़ील्ड चिह्नित हैं *