R'de scale() fonksiyonu nasıl kullanılır (örneklerle)
R’deki Scale() işlevi, bir vektör, matris veya veri çerçevesindeki değerleri ölçeklendirmek için kullanılabilir.
Bu işlev aşağıdaki temel sözdizimini kullanır:
scale(x, center = TRUE , scale = TRUE )
Altın:
- x : Ölçeklenecek nesnenin adı
- center : ölçeklendirme sırasında ortalamanın çıkarılıp çıkarılmayacağı. Varsayılan DOĞRU’dur.
- ölçek : Ölçeklendirme sırasında standart sapmaya bölünüp bölünmeyeceği. Varsayılan DOĞRU’dur.
Bu işlev, ölçeklendirilmiş değerleri hesaplamak için aşağıdaki formülü kullanır:
ölçeklendirilmiş x = ( orijinal x – x̄) / s
Altın:
- orijinal x : Orijinal x değeri
- x̄ : Örnek şu anlama gelir:
- s : numunenin standart sapması
Bu aynı zamanda her orijinal değeri bir z puanına dönüştüren veri normalleştirmesi olarak da bilinir.
Aşağıdaki örnekler bu fonksiyonun pratikte nasıl kullanılacağını göstermektedir.
Örnek 1: Bir Vektörde Değerleri Ölçeklendir
R’de aşağıdaki değer vektörüne sahip olduğumuzu varsayalım:
#define vector of values x <- c(1, 2, 3, 4, 5, 6, 7, 8, 9) #view mean and standard deviation of values mean(x) [1] 5 sd(x) [1] 2.738613
Aşağıdaki kod, Scale() işlevini kullanarak vektör değerlerinin nasıl ölçeklendirileceğini gösterir:
#scale the values of x x_scaled <- scale(x) #view scaled values x_scaled [,1] [1,] -1.4605935 [2,] -1.0954451 [3,] -0.7302967 [4,] -0.3651484 [5,] 0.0000000 [6,] 0.3651484 [7,] 0.7302967 [8,] 1.0954451 [9,] 1.4605935
Her ölçeklendirilmiş değerin nasıl hesaplandığı aşağıda açıklanmıştır:
- Değer 1: (1 – 5) / 2,738613 = -1,46
- Değer 2: (2 – 5) / 2,738613 = -1,09
- Değer 3: (3 – 5) / 2,738613 = -0,73
Ve benzeri.
Scale=FALSE belirtirsek, ölçeklendirme sırasında fonksiyonun standart sapmaya bölünmeyeceğini unutmayın:
#scale the values of x but don't divide by standard deviation x_scaled <- scale(x, scale = FALSE ) #view scaled values x_scaled [,1] [1,] -4 [2,] -3 [3,] -2 [4,] -1 [5,] 0 [6,] 1 [7,] 2 [8,] 3 [9,] 4
Her ölçeklendirilmiş değerin nasıl hesaplandığı aşağıda açıklanmıştır:
- Değer 1: 1 – 5 = -4
- Değer 2: 2 – 5 = -3
- Değer 3: 3 – 5 = -2
Ve benzeri.
Örnek 2: Bir veri çerçevesindeki sütun değerlerini ölçeklendirme
Çoğu zaman, bir veri çerçevesindeki birden fazla sütunun değerlerini, her sütunun ortalaması 0 ve standart sapması 1 olacak şekilde ölçeklendirmek istediğimizde Scale() işlevini kullanırız.
Örneğin, R’de aşağıdaki veri çerçevesine sahip olduğumuzu varsayalım:
#create data frame df <- data. frame (x=c(1, 2, 3, 4, 5, 6, 7, 8, 9), y=c(10, 20, 30, 40, 50, 60, 70, 80, 90)) #view data frame df xy 1 1 10 2 2 20 3 3 30 4 4 40 5 5 50 6 6 60 7 7 70 8 8 80 9 9 90
Y değişkeninin değer aralığının, x değişkeninin değer aralığından çok daha büyük olduğunu unutmayın.
İki sütundaki değerleri, x ve y’nin ölçeklendirilmiş değerlerinin her ikisinin de ortalaması 0 ve standart sapması 1 olacak şekilde ölçeklendirmek için Scale() işlevini kullanabiliriz:
#scale values in each column of data frame df_scaled <- scale(df) #view scaled data frame df_scaled xy [1,] -1.4605935 -1.4605935 [2,] -1.0954451 -1.0954451 [3,] -0.7302967 -0.7302967 [4,] -0.3651484 -0.3651484 [5,] 0.0000000 0.0000000 [6,] 0.3651484 0.3651484 [7,] 0.7302967 0.7302967 [8,] 1.0954451 1.0954451 [9,] 1.4605935 1.4605935
X ve y sütunlarının ortalaması 0, standart sapması ise 1’dir.
Ek kaynaklar
Aşağıdaki eğitimlerde R’de diğer yaygın işlemlerin nasıl gerçekleştirileceği açıklanmaktadır:
R’deki veriler nasıl normalleştirilir
R’deki veriler nasıl standartlaştırılır
R’deki sütunların ortalaması nasıl alınır?