आर में स्केल () फ़ंक्शन का उपयोग कैसे करें (उदाहरण के साथ)
R में स्केल() फ़ंक्शन का उपयोग वेक्टर, मैट्रिक्स या डेटा फ़्रेम में मानों को स्केल करने के लिए किया जा सकता है।
यह फ़ंक्शन निम्नलिखित मूल सिंटैक्स का उपयोग करता है:
scale(x, center = TRUE , scale = TRUE )
सोना:
- x : पैमाने पर वस्तु का नाम
- केंद्र : स्केलिंग करते समय माध्य घटाना है या नहीं। डिफ़ॉल्ट सत्य है.
- स्केल : स्केलिंग करते समय मानक विचलन से विभाजित करना है या नहीं। डिफ़ॉल्ट सत्य है.
यह फ़ंक्शन स्केल किए गए मानों की गणना करने के लिए निम्नलिखित सूत्र का उपयोग करता है:
स्केल किया गया x = ( मूल x – x̄) / s
सोना:
- मूल x : मूल x मान
- x̄ : नमूना का अर्थ है
- s : नमूने का मानक विचलन
इसे डेटा सामान्यीकरण के रूप में भी जाना जाता है, जो प्रत्येक मूल मान को z-स्कोर में परिवर्तित करता है।
निम्नलिखित उदाहरण दिखाते हैं कि व्यवहार में इस फ़ंक्शन का उपयोग कैसे करें।
उदाहरण 1: एक वेक्टर में स्केल मान
मान लीजिए कि हमारे पास R में मानों का निम्नलिखित वेक्टर है:
#define vector of values x <- c(1, 2, 3, 4, 5, 6, 7, 8, 9) #view mean and standard deviation of values mean(x) [1] 5 sd(x) [1] 2.738613
निम्नलिखित कोड दिखाता है कि स्केल() फ़ंक्शन का उपयोग करके वेक्टर मानों को कैसे स्केल किया जाए:
#scale the values of x x_scaled <- scale(x) #view scaled values x_scaled [,1] [1,] -1.4605935 [2,] -1.0954451 [3,] -0.7302967 [4,] -0.3651484 [5,] 0.0000000 [6,] 0.3651484 [7,] 0.7302967 [8,] 1.0954451 [9,] 1.4605935
यहां बताया गया है कि प्रत्येक स्केल किए गए मान की गणना कैसे की गई:
- मान 1: (1 – 5) / 2.738613 = -1.46
- मान 2: (2 – 5) / 2.738613 = -1.09
- मान 3: (3 – 5) / 2.738613 = -0.73
और इसी तरह।
ध्यान दें कि यदि हम स्केल=गलत निर्दिष्ट करते हैं तो स्केलिंग करते समय फ़ंक्शन मानक विचलन से विभाजित नहीं होगा:
#scale the values of x but don't divide by standard deviation x_scaled <- scale(x, scale = FALSE ) #view scaled values x_scaled [,1] [1,] -4 [2,] -3 [3,] -2 [4,] -1 [5,] 0 [6,] 1 [7,] 2 [8,] 3 [9,] 4
यहां बताया गया है कि प्रत्येक स्केल किए गए मान की गणना कैसे की गई:
- मान 1: 1 – 5 = -4
- मान 2: 2 – 5 = -3
- मान 3: 3 – 5 = -2
और इसी तरह।
उदाहरण 2: डेटा फ़्रेम में कॉलम मानों को स्केल करें
अक्सर, हम स्केल() फ़ंक्शन का उपयोग तब करते हैं जब हम डेटा फ़्रेम में एकाधिक कॉलम के मानों को स्केल करना चाहते हैं जैसे कि प्रत्येक कॉलम का माध्य 0 और मानक विचलन 1 हो।
उदाहरण के लिए, मान लें कि हमारे पास R में निम्नलिखित डेटा फ़्रेम है:
#create data frame df <- data. frame (x=c(1, 2, 3, 4, 5, 6, 7, 8, 9), y=c(10, 20, 30, 40, 50, 60, 70, 80, 90)) #view data frame df xy 1 1 10 2 2 20 3 3 30 4 4 40 5 5 50 6 6 60 7 7 70 8 8 80 9 9 90
ध्यान दें कि y वेरिएबल के मानों की सीमा x वेरिएबल के मानों की सीमा से बहुत बड़ी है।
हम दो कॉलमों में मानों को स्केल करने के लिए स्केल() फ़ंक्शन का उपयोग कर सकते हैं जैसे कि x और y दोनों के स्केल किए गए मानों का माध्य 0 और मानक विचलन 1 हो:
#scale values in each column of data frame df_scaled <- scale(df) #view scaled data frame df_scaled xy [1,] -1.4605935 -1.4605935 [2,] -1.0954451 -1.0954451 [3,] -0.7302967 -0.7302967 [4,] -0.3651484 -0.3651484 [5,] 0.0000000 0.0000000 [6,] 0.3651484 0.3651484 [7,] 0.7302967 0.7302967 [8,] 1.0954451 1.0954451 [9,] 1.4605935 1.4605935
x और y कॉलम का माध्य अब 0 और मानक विचलन 1 है।
अतिरिक्त संसाधन
निम्नलिखित ट्यूटोरियल बताते हैं कि आर में अन्य सामान्य ऑपरेशन कैसे करें:
आर में डेटा को सामान्य कैसे करें
आर में डेटा का मानकीकरण कैसे करें
आर में कॉलमों का औसत कैसे निकालें