R'de yalnızca sayısal sütunlar nasıl ölçeklenir (örnekle)


R’deki bir veri çerçevesinin yalnızca sayısal sütunlarını ölçeklendirmek için dplyr paketindeki aşağıdaki sözdizimini kullanabilirsiniz:

 library (dplyr)

df %>% mutate(across(where(is. numeric ), scale))

Aşağıdaki örnekte bu fonksiyonun pratikte nasıl kullanılacağı gösterilmektedir.

Örnek: dplyr kullanarak yalnızca sayısal sütunları ölçeklendirme

R’de çeşitli basketbol oyuncuları hakkında bilgi içeren aşağıdaki veri çerçevesine sahip olduğumuzu varsayalım:

 #create data frame
df <- data. frame (team=c('A', 'B', 'C', 'D', 'E'),
                 dots=c(22, 34, 30, 12, 18),
                 assists=c(7, 9, 9, 12, 14),
                 rebounds=c(5, 10, 10, 8, 8))

#view data frame
df

  team points assists rebounds
1 to 22 7 5
2 B 34 9 10
3 C 30 9 10
4 D 12 12 8
5 E 18 14 8

Veri çerçevesinin yalnızca sayısal sütunlarını ölçeklendirmek için R’deki ölçek işlevini kullanmak istediğimizi varsayalım.

Bunu yapmak için aşağıdaki sözdizimini kullanabiliriz:

 library (dplyr)

#scale only the numeric columns in the data frame
df %>% mutate(across(where(is. numeric ), scale))

  team points assists rebounds
1 A -0.1348400 -1.153200 -1.56144012
2 B 1.2135598 -0.432450 0.87831007
3 C 0.7640932 -0.432450 0.87831007
4 D -1.2585064 0.648675 -0.09759001
5 E -0.5843065 1.369425 -0.09759001

Üç sayısal sütundaki değerlerin ( sayılar , asistler ve ribaundlar ) takım sütunu değişmeden kalırken ölçeklendirildiğini unutmayın.

Teknik notlar

R’deki Scale() işlevi aşağıdaki temel sözdizimini kullanır:

 scale(x, center = TRUE , scale = TRUE )

Altın:

  • x : Ölçeklenecek nesnenin adı
  • center : ölçeklendirme sırasında ortalamanın çıkarılıp çıkarılmayacağı. Varsayılan DOĞRU’dur.
  • ölçek : Ölçeklendirme sırasında standart sapmaya bölünüp bölünmeyeceği. Varsayılan DOĞRU’dur.

Bu işlev, ölçeklendirilmiş değerleri hesaplamak için aşağıdaki formülü kullanır:

ölçeklendirilmiş x = ( orijinal x – x̄) / s

Altın:

  • orijinal x : Orijinal x değeri
  • : Örnek şu anlama gelir:
  • s : numunenin standart sapması

Bu aynı zamanda her orijinal değeri bir z puanına dönüştüren veri normalleştirmesi olarak da bilinir.

Ek kaynaklar

Aşağıdaki eğitimlerde dplyr kullanılarak diğer genel görevlerin nasıl gerçekleştirileceği açıklanmaktadır:

Dplyr kullanarak ada göre sütunlar nasıl seçilir
Dplyr kullanarak dizine göre sütunlar nasıl seçilir
Select_if’i dplyr’de birden çok koşulla kullanma

Yorum ekle

E-posta hesabınız yayımlanmayacak. Gerekli alanlar * ile işaretlenmişlerdir