R'de niceliksel normalizasyon nasıl gerçekleştirilir?


İstatistikte kantil normalizasyon , iki dağılımı istatistiksel özellikler açısından özdeş hale getiren bir yöntemdir.

Aşağıdaki örnek, R’de niceliksel normalleştirmenin nasıl gerçekleştirileceğini gösterir.

Örnek: R’de nicelik normalizasyonu

R’de iki sütun içeren aşağıdaki veri çerçevesini oluşturduğumuzu varsayalım:

 #make this example reproducible
set. seeds (0)

#create data frame with two columns
df <- data. frame (x=rnorm(1000),
                 y=rnorm(1000))

#view first six rows of data frame
head(df)

           xy
1 1.2629543 -0.28685156
2 -0.3262334 1.84110689
3 1.3297993 -0.15676431
4 1.2724293 -1.38980264
5 0.4146414 -1.47310399
6 -1.5399500 -0.06951893

X ve y’nin niceliklerini hesaplamak için sapply() ve quantile() işlevlerini kullanabiliriz:

 #calculate quantiles for x and y
sapply(df, function(x) quantile(x, probs = seq(0, 1, 1/4)))

               xy
0% -3.23638573 -3.04536393
25% -0.70845589 -0.73331907
50% -0.05887078 -0.03181533
75% 0.68763873 0.71755969
100% 3.26641452 3.03903341

X ve y’nin yüzdelikler için benzer değerlere sahip olduğunu ancak aynı değerlerin olmadığını unutmayın.

Örneğin, x için 25. yüzdelik değer -0,708 ve y için 25. yüzdelik değer -0,7333’tür .

Kantil normalizasyonu gerçekleştirmek için R’deki preprocessCore paketindeki normalize.quantiles() fonksiyonunu kullanabiliriz:

 library (preprocessCore)

#perform quantile normalization
df_norm <- as. data . frame ( normalize.quantiles ( as.matrix (df)))

#rename data frame columns
names(df_norm) <- c(' x ', ' y ')

#view first six row of new data frame
head(df_norm)

           xy
1 1.2632137 -0.28520228
2 -0.3469744 1.82440519
3 1.3465807 -0.16471644
4 1.2692599 -1.34472394
5 0.4161133 -1.43717759
6 -1.6269731 -0.07906793

Daha sonra x ve y’nin yüzdelik dilimlerini tekrar hesaplamak için aşağıdaki kodu kullanabiliriz:

 #calculate quantiles for x and y
sapply(df_norm, function(x) quantile(x, probs = seq(0, 1, 1/4)))

               xy
0% -3.14087483 -3.14087483
25% -0.72088748 -0.72088748
50% -0.04534305 -0.04534305
75% 0.70259921 0.70259921
100% 3.15272396 3.15272396

Yüzdelik değerlerin artık x ve y için aynı olduğunu unutmayın.

X ve y’nin nicelik normalize edildiğini söyleyebiliriz. Başka bir deyişle, iki dağılım artık istatistiksel özellikler açısından aynıdır.

Ek kaynaklar

Aşağıdaki eğitimlerde R’de diğer ortak görevlerin nasıl gerçekleştirileceği açıklanmaktadır:

R’deki veriler nasıl normalleştirilir
R’de yüzdelikler nasıl hesaplanır
R’de quantile () işlevi nasıl kullanılır?

Yorum ekle

E-posta hesabınız yayımlanmayacak. Gerekli alanlar * ile işaretlenmişlerdir