आर में क्वांटाइल सामान्यीकरण कैसे करें
आंकड़ों में, क्वांटाइल सामान्यीकरण एक ऐसी विधि है जो सांख्यिकीय गुणों के संदर्भ में दो वितरणों को समान बनाती है।
निम्नलिखित उदाहरण दिखाता है कि आर में क्वांटाइल सामान्यीकरण कैसे करें।
उदाहरण: आर में मात्रात्मक सामान्यीकरण
मान लीजिए कि हम R में निम्नलिखित डेटा फ़्रेम बनाते हैं जिसमें दो कॉलम हैं:
#make this example reproducible set. seeds (0) #create data frame with two columns df <- data. frame (x=rnorm(1000), y=rnorm(1000)) #view first six rows of data frame head(df) xy 1 1.2629543 -0.28685156 2 -0.3262334 1.84110689 3 1.3297993 -0.15676431 4 1.2724293 -1.38980264 5 0.4146414 -1.47310399 6 -1.5399500 -0.06951893
हम x और y की मात्राओं की गणना करने के लिए sapply() और quantile() फ़ंक्शन का उपयोग कर सकते हैं:
#calculate quantiles for x and y
sapply(df, function(x) quantile(x, probs = seq(0, 1, 1/4)))
xy
0% -3.23638573 -3.04536393
25% -0.70845589 -0.73331907
50% -0.05887078 -0.03181533
75% 0.68763873 0.71755969
100% 3.26641452 3.03903341
ध्यान दें कि x और y में मात्राओं के लिए समान मान हैं, लेकिन समान मान नहीं हैं।
उदाहरण के लिए, x के लिए 25वां प्रतिशतक मान -0.708 है और y के लिए 25वां प्रतिशतक मान -0.7333 है।
क्वांटाइल सामान्यीकरण करने के लिए, हम आर में प्रीप्रोसेसकोर पैकेज से नॉर्मलाइज़.क्वांटाइल्स () फ़ंक्शन का उपयोग कर सकते हैं:
library (preprocessCore) #perform quantile normalization df_norm <- as. data . frame ( normalize.quantiles ( as.matrix (df))) #rename data frame columns names(df_norm) <- c(' x ', ' y ') #view first six row of new data frame head(df_norm) xy 1 1.2632137 -0.28520228 2 -0.3469744 1.82440519 3 1.3465807 -0.16471644 4 1.2692599 -1.34472394 5 0.4161133 -1.43717759 6 -1.6269731 -0.07906793
फिर हम x और y की मात्राओं की दोबारा गणना करने के लिए निम्नलिखित कोड का उपयोग कर सकते हैं:
#calculate quantiles for x and y
sapply(df_norm, function(x) quantile(x, probs = seq(0, 1, 1/4)))
xy
0% -3.14087483 -3.14087483
25% -0.72088748 -0.72088748
50% -0.04534305 -0.04534305
75% 0.70259921 0.70259921
100% 3.15272396 3.15272396
ध्यान दें कि मात्राएँ अब x और y के लिए समान हैं।
हम कहेंगे कि x और y को मात्रात्मक रूप से सामान्यीकृत किया गया है। दूसरे शब्दों में, दोनों वितरण अब सांख्यिकीय गुणों के संदर्भ में समान हैं।
अतिरिक्त संसाधन
निम्नलिखित ट्यूटोरियल बताते हैं कि आर में अन्य सामान्य कार्य कैसे करें:
आर में डेटा को सामान्य कैसे करें
आर में प्रतिशतक की गणना कैसे करें
आर में क्वांटाइल () फ़ंक्शन का उपयोग कैसे करें