R'de scale() fonksiyonu nasıl kullanılır (örneklerle)


R’deki Scale() işlevi, bir vektör, matris veya veri çerçevesindeki değerleri ölçeklendirmek için kullanılabilir.

Bu işlev aşağıdaki temel sözdizimini kullanır:

 scale(x, center = TRUE , scale = TRUE )

Altın:

  • x : Ölçeklenecek nesnenin adı
  • center : ölçeklendirme sırasında ortalamanın çıkarılıp çıkarılmayacağı. Varsayılan DOĞRU’dur.
  • ölçek : Ölçeklendirme sırasında standart sapmaya bölünüp bölünmeyeceği. Varsayılan DOĞRU’dur.

Bu işlev, ölçeklendirilmiş değerleri hesaplamak için aşağıdaki formülü kullanır:

ölçeklendirilmiş x = ( orijinal x – x̄) / s

Altın:

  • orijinal x : Orijinal x değeri
  • : Örnek şu anlama gelir:
  • s : numunenin standart sapması

Bu aynı zamanda her orijinal değeri bir z puanına dönüştüren veri normalleştirmesi olarak da bilinir.

Aşağıdaki örnekler bu fonksiyonun pratikte nasıl kullanılacağını göstermektedir.

Örnek 1: Bir Vektörde Değerleri Ölçeklendir

R’de aşağıdaki değer vektörüne sahip olduğumuzu varsayalım:

 #define vector of values
x <- c(1, 2, 3, 4, 5, 6, 7, 8, 9)

#view mean and standard deviation of values
mean(x)

[1] 5

sd(x)

[1] 2.738613

Aşağıdaki kod, Scale() işlevini kullanarak vektör değerlerinin nasıl ölçeklendirileceğini gösterir:

 #scale the values of x
x_scaled <- scale(x)

#view scaled values
x_scaled

            [,1]
 [1,] -1.4605935
 [2,] -1.0954451
 [3,] -0.7302967
 [4,] -0.3651484
 [5,] 0.0000000
 [6,] 0.3651484
 [7,] 0.7302967
 [8,] 1.0954451
 [9,] 1.4605935

Her ölçeklendirilmiş değerin nasıl hesaplandığı aşağıda açıklanmıştır:

  • Değer 1: (1 – 5) / 2,738613 = -1,46
  • Değer 2: (2 – 5) / 2,738613 = -1,09
  • Değer 3: (3 – 5) / 2,738613 = -0,73

Ve benzeri.

Scale=FALSE belirtirsek, ölçeklendirme sırasında fonksiyonun standart sapmaya bölünmeyeceğini unutmayın:

 #scale the values of x but don't divide by standard deviation
x_scaled <- scale(x, scale = FALSE )

#view scaled values
x_scaled

      [,1]
 [1,] -4
 [2,] -3
 [3,] -2
 [4,] -1
 [5,] 0
 [6,] 1
 [7,] 2
 [8,] 3
 [9,] 4

Her ölçeklendirilmiş değerin nasıl hesaplandığı aşağıda açıklanmıştır:

  • Değer 1: 1 – 5 = -4
  • Değer 2: 2 – 5 = -3
  • Değer 3: 3 – 5 = -2

Ve benzeri.

Örnek 2: Bir veri çerçevesindeki sütun değerlerini ölçeklendirme

Çoğu zaman, bir veri çerçevesindeki birden fazla sütunun değerlerini, her sütunun ortalaması 0 ve standart sapması 1 olacak şekilde ölçeklendirmek istediğimizde Scale() işlevini kullanırız.

Örneğin, R’de aşağıdaki veri çerçevesine sahip olduğumuzu varsayalım:

 #create data frame
df <- data. frame (x=c(1, 2, 3, 4, 5, 6, 7, 8, 9),
                 y=c(10, 20, 30, 40, 50, 60, 70, 80, 90))

#view data frame
df

  xy
1 1 10
2 2 20
3 3 30
4 4 40
5 5 50
6 6 60
7 7 70
8 8 80
9 9 90

Y değişkeninin değer aralığının, x değişkeninin değer aralığından çok daha büyük olduğunu unutmayın.

İki sütundaki değerleri, x ve y’nin ölçeklendirilmiş değerlerinin her ikisinin de ortalaması 0 ve standart sapması 1 olacak şekilde ölçeklendirmek için Scale() işlevini kullanabiliriz:

 #scale values in each column of data frame
df_scaled <- scale(df)

#view scaled data frame
df_scaled

               xy
 [1,] -1.4605935 -1.4605935
 [2,] -1.0954451 -1.0954451
 [3,] -0.7302967 -0.7302967
 [4,] -0.3651484 -0.3651484
 [5,] 0.0000000 0.0000000
 [6,] 0.3651484 0.3651484
 [7,] 0.7302967 0.7302967
 [8,] 1.0954451 1.0954451
 [9,] 1.4605935 1.4605935

X ve y sütunlarının ortalaması 0, standart sapması ise 1’dir.

Ek kaynaklar

Aşağıdaki eğitimlerde R’de diğer yaygın işlemlerin nasıl gerçekleştirileceği açıklanmaktadır:

R’deki veriler nasıl normalleştirilir
R’deki veriler nasıl standartlaştırılır
R’deki sütunların ortalaması nasıl alınır?

Yorum ekle

E-posta hesabınız yayımlanmayacak. Gerekli alanlar * ile işaretlenmişlerdir