R'de quantile () işlevi nasıl kullanılır?

İle Dr.benjamin anderson Temmuz 24, 2023 Rehber 0 Yorum

İstatistikte kantiller , sınıflandırılmış bir veri setini eşit gruplara bölen değerlerdir.

R’deki quantile() işlevi, bir veri kümesinin örnek niceliklerini hesaplamak için kullanılabilir.

Bu işlev aşağıdaki temel sözdizimini kullanır:

nicelik(x, olasılıklar = sıra(0, 1, 0,25), na.rm = YANLIŞ)

Altın:

x : Vektör adı
probs : Olasılıkların sayısal vektörü
na.rm : NA değerlerinin kaldırılıp kaldırılmayacağı

Aşağıdaki örnekler bu fonksiyonun pratikte nasıl kullanılacağını göstermektedir.

Örnek 1: Bir vektörün yüzdelik dilimlerini hesaplama

Aşağıdaki kod, R’deki bir vektörün yüzdeliklerinin nasıl hesaplanacağını gösterir:

 #define vector of data 
data = c(1, 3, 3, 4, 5, 7, 8, 9, 12, 13, 13, 15, 18, 20, 22, 23, 24, 28)

#calculate quartiles
quantile(data, probs = seq(0, 1, 1/4))

 0% 25% 50% 75% 100% 
1.0 5.5 12.5 19.5 28.0 

#calculate quintiles
quantile(data, probs = seq(0, 1, 1/5))

 0% 20% 40% 60% 80% 100% 
1.0 4.4 8.8 13.4 21.2 28.0 

#calculate deciles
quantile(data, probs = seq(0, 1, 1/10))

 0% 10% 20% 30% 40% 50% 60% 70% 80% 90% 100% 
1.0 3.0 4.4 7.1 8.8 12.5 13.4 17.7 21.2 23.3 28.0 

#calculate random quantiles of interest
quantile(data, probs = c(.2, .5, .9))

20% 50% 90% 
4.4 12.5 23.3

Örnek 2: Veri çerçevesindeki sütunların yüzdelik dilimlerini hesaplama

Aşağıdaki kod, bir veri çerçevesindeki belirli bir sütun için niceliklerin nasıl hesaplanacağını gösterir:

 #create data frame
df <- data. frame (var1=c(1, 3, 3, 4, 5, 7, 7, 8, 12, 14, 18),
                 var2=c(7, 7, 8, 3, 2, 6, 8, 9, 11, 11, 16),
                 var3=c(3, 3, 6, 6, 8, 4, 4, 7, 10, 10, 11))

#calculate quartiles of column 'var2'
quantile(df$var2, probs = seq(0, 1, 1/4))

  0% 25% 50% 75% 100% 
 2.0 6.5 8.0 10.0 16.0

Aynı anda birden fazla sütunun miktarlarını hesaplamak için sapply() işlevini de kullanabiliriz:

 #calculate quartiles of every column
sapply(df, function (x) quantile(x, probs = seq(0, 1, 1/4)))

     var1 var2 var3
0% 1.0 2.0 3
25% 3.5 6.5 4
50% 7.0 8.0 6
75% 10.0 10.0 9
100% 18.0 16.0 11

Örnek 3: yüzdelik dilimleri gruba göre hesaplama

Aşağıdaki kod, bir gruplama değişkenine göre nicelikleri hesaplamak için dplyr paketindeki işlevlerin nasıl kullanılacağını gösterir:

 library (dplyr)

#define data frame
df <- data. frame (team=c('A', 'A', 'A', 'A', 'B', 'B', 'B', 'B', 'C', 'C', 'C') ,
                 points=c(1, 3, 3, 4, 5, 7, 7, 8, 12, 14, 18))

#define quantiles of interest
q = c(.25, .5, .75)

#calculate quantiles by grouping variable
df %>%
  group_by(team) %>%
  summarize(quant25 = quantile(points, probs = q[1]), 
            quant50 = quantile(points, probs = q[2]),
            quant75 = quantile(points, probs = q[3]))

# A tibble: 3 x 4
  team quant25 quant50 quant75
           
1 to 2.5 3 3.25
2 B 6.5 7 7.25
3 C 13 14 16

Ek kaynaklar

Aşağıdaki eğitimler, diğer ortak nicelik değerlerini hesaplamak için quantile() işlevinin nasıl kullanılacağını gösterir:

R’de yüzdelikler nasıl hesaplanır
R’de ondalık sayılar nasıl hesaplanır
R’de çeyrekler nasıl hesaplanır

yazar hakkında

Dr.benjamin anderson

Merhaba, ben Benjamin, emekli bir istatistik profesörü ve Statorials öğretmenine dönüştüm. İstatistik alanındaki kapsamlı deneyimim ve uzmanlığımla, öğrencilerimi Statorials aracılığıyla güçlendirmek için bilgilerimi paylaşmaya can atıyorum. Daha fazlasını bil