आर में स्केल () फ़ंक्शन का उपयोग कैसे करें (उदाहरण के साथ)


R में स्केल() फ़ंक्शन का उपयोग वेक्टर, मैट्रिक्स या डेटा फ़्रेम में मानों को स्केल करने के लिए किया जा सकता है।

यह फ़ंक्शन निम्नलिखित मूल सिंटैक्स का उपयोग करता है:

 scale(x, center = TRUE , scale = TRUE )

सोना:

  • x : पैमाने पर वस्तु का नाम
  • केंद्र : स्केलिंग करते समय माध्य घटाना है या नहीं। डिफ़ॉल्ट सत्य है.
  • स्केल : स्केलिंग करते समय मानक विचलन से विभाजित करना है या नहीं। डिफ़ॉल्ट सत्य है.

यह फ़ंक्शन स्केल किए गए मानों की गणना करने के लिए निम्नलिखित सूत्र का उपयोग करता है:

स्केल किया गया x = ( मूल x – x̄) / s

सोना:

  • मूल x : मूल x मान
  • : नमूना का अर्थ है
  • s : नमूने का मानक विचलन

इसे डेटा सामान्यीकरण के रूप में भी जाना जाता है, जो प्रत्येक मूल मान को z-स्कोर में परिवर्तित करता है।

निम्नलिखित उदाहरण दिखाते हैं कि व्यवहार में इस फ़ंक्शन का उपयोग कैसे करें।

उदाहरण 1: एक वेक्टर में स्केल मान

मान लीजिए कि हमारे पास R में मानों का निम्नलिखित वेक्टर है:

 #define vector of values
x <- c(1, 2, 3, 4, 5, 6, 7, 8, 9)

#view mean and standard deviation of values
mean(x)

[1] 5

sd(x)

[1] 2.738613

निम्नलिखित कोड दिखाता है कि स्केल() फ़ंक्शन का उपयोग करके वेक्टर मानों को कैसे स्केल किया जाए:

 #scale the values of x
x_scaled <- scale(x)

#view scaled values
x_scaled

            [,1]
 [1,] -1.4605935
 [2,] -1.0954451
 [3,] -0.7302967
 [4,] -0.3651484
 [5,] 0.0000000
 [6,] 0.3651484
 [7,] 0.7302967
 [8,] 1.0954451
 [9,] 1.4605935

यहां बताया गया है कि प्रत्येक स्केल किए गए मान की गणना कैसे की गई:

  • मान 1: (1 – 5) / 2.738613 = -1.46
  • मान 2: (2 – 5) / 2.738613 = -1.09
  • मान 3: (3 – 5) / 2.738613 = -0.73

और इसी तरह।

ध्यान दें कि यदि हम स्केल=गलत निर्दिष्ट करते हैं तो स्केलिंग करते समय फ़ंक्शन मानक विचलन से विभाजित नहीं होगा:

 #scale the values of x but don't divide by standard deviation
x_scaled <- scale(x, scale = FALSE )

#view scaled values
x_scaled

      [,1]
 [1,] -4
 [2,] -3
 [3,] -2
 [4,] -1
 [5,] 0
 [6,] 1
 [7,] 2
 [8,] 3
 [9,] 4

यहां बताया गया है कि प्रत्येक स्केल किए गए मान की गणना कैसे की गई:

  • मान 1: 1 – 5 = -4
  • मान 2: 2 – 5 = -3
  • मान 3: 3 – 5 = -2

और इसी तरह।

उदाहरण 2: डेटा फ़्रेम में कॉलम मानों को स्केल करें

अक्सर, हम स्केल() फ़ंक्शन का उपयोग तब करते हैं जब हम डेटा फ़्रेम में एकाधिक कॉलम के मानों को स्केल करना चाहते हैं जैसे कि प्रत्येक कॉलम का माध्य 0 और मानक विचलन 1 हो।

उदाहरण के लिए, मान लें कि हमारे पास R में निम्नलिखित डेटा फ़्रेम है:

 #create data frame
df <- data. frame (x=c(1, 2, 3, 4, 5, 6, 7, 8, 9),
                 y=c(10, 20, 30, 40, 50, 60, 70, 80, 90))

#view data frame
df

  xy
1 1 10
2 2 20
3 3 30
4 4 40
5 5 50
6 6 60
7 7 70
8 8 80
9 9 90

ध्यान दें कि y वेरिएबल के मानों की सीमा x वेरिएबल के मानों की सीमा से बहुत बड़ी है।

हम दो कॉलमों में मानों को स्केल करने के लिए स्केल() फ़ंक्शन का उपयोग कर सकते हैं जैसे कि x और y दोनों के स्केल किए गए मानों का माध्य 0 और मानक विचलन 1 हो:

 #scale values in each column of data frame
df_scaled <- scale(df)

#view scaled data frame
df_scaled

               xy
 [1,] -1.4605935 -1.4605935
 [2,] -1.0954451 -1.0954451
 [3,] -0.7302967 -0.7302967
 [4,] -0.3651484 -0.3651484
 [5,] 0.0000000 0.0000000
 [6,] 0.3651484 0.3651484
 [7,] 0.7302967 0.7302967
 [8,] 1.0954451 1.0954451
 [9,] 1.4605935 1.4605935

x और y कॉलम का माध्य अब 0 और मानक विचलन 1 है।

अतिरिक्त संसाधन

निम्नलिखित ट्यूटोरियल बताते हैं कि आर में अन्य सामान्य ऑपरेशन कैसे करें:

आर में डेटा को सामान्य कैसे करें
आर में डेटा का मानकीकरण कैसे करें
आर में कॉलमों का औसत कैसे निकालें

एक टिप्पणी जोड़ने

आपका ईमेल पता प्रकाशित नहीं किया जाएगा. आवश्यक फ़ील्ड चिह्नित हैं *