R'de ondalık sayılar nasıl hesaplanır (örneklerle)
İstatistikte ondalık sayılar, bir veri kümesini eşit frekansta on gruba bölen sayılardır.
İlk ondalık dilim, tüm veri değerlerinin %10’unun altına düştüğü noktadır. İkinci ondalık dilim, tüm veri değerlerinin %20’sinin altına düştüğü noktadır ve bu böyle devam eder.
R’deki bir veri kümesinin ondalık dilimlerini hesaplamak için aşağıdaki sözdizimini kullanabiliriz:
quantile(data, probs = seq (.1, .9, by = .1 ))
Aşağıdaki örnekte bu fonksiyonun pratikte nasıl kullanılacağı gösterilmektedir.
Örnek: R’de ondalık sayıları hesaplama
Aşağıdaki kod, 20 değere sahip sahte bir veri kümesinin nasıl oluşturulacağını ve ardından veri kümesinin ondalık değerlerinin nasıl hesaplanacağını gösterir:
#create dataset data <- c(56, 58, 64, 67, 68, 73, 78, 83, 84, 88, 89, 90, 91, 92, 93, 93, 94, 95, 97, 99) #calculate deciles of dataset quantile(data, probs = seq (.1, .9, by = .1 )) 10% 20% 30% 40% 50% 60% 70% 80% 90% 63.4 67.8 76.5 83.6 88.5 90.4 92.3 93.2 95.2
Ondalık sayıları yorumlamanın yolu aşağıdaki gibidir:
- Tüm veri değerlerinin %10’u 63,4’ten azdır
- Tüm veri değerlerinin %20’si 67,8’den küçüktür.
- Tüm veri değerlerinin %30’u 76,5’tan küçüktür.
- Tüm veri değerlerinin %40’ı 83,6’dan küçüktür.
- Tüm veri değerlerinin %50’si 88,5’ten küçüktür.
- Tüm veri değerlerinin %60’ı 90,4’ten küçüktür.
- Tüm veri değerlerinin %70’i 92,3’ten küçüktür.
- Tüm veri değerlerinin %80’i 93,2’den küçüktür.
- Tüm veri değerlerinin %90’ı 95,2’den küçüktür.
50. yüzdelik dilimdeki değerin veri kümesinin ortanca değerine eşit olduğunu belirtmek gerekir.
Örnek: değerleri R’de ondalık sayılara yerleştirme
Her veri değerini ondalık dilime yerleştirmek için R’deki dplyr paketindeki ntile(x, ngroups) fonksiyonunu kullanabiliriz.
Önceki örnekte oluşturduğumuz veri kümesi için bu işlevin nasıl kullanılacağı aşağıda açıklanmıştır:
library (dplyr) #create dataset data <- data.frame(values=c(56, 58, 64, 67, 68, 73, 78, 83, 84, 88, 89, 90, 91, 92, 93, 93, 94, 95, 97, 99)) #place each value into a decile data$decile <- ntile(data, 10) #viewdata data values decile 1 56 1 2 58 1 3 64 2 4 67 2 5 68 3 6 73 3 7 78 4 8 83 4 9 84 5 10 88 5 11 89 6 12 90 6 13 91 7 14 92 7 15 93 8 16 93 8 17 94 9 18 95 9 19 97 10 20 99 10
Sonucun yorumlanma şekli şu şekildedir:
- 56 veri değeri %0 ile %10 yüzdelik dilim arasında olduğundan ilk ondalık dilimde yer alır.
- 58 veri değeri %0 ile %10 yüzdelik dilim arasında olduğundan ilk ondalık dilimde yer alır.
- Veri değeri 64 %10 ila %20 yüzdelik dilim arasında olduğundan ikinci ondalık dilimde yer alır.
- Veri değeri 67 %10 ila %20 yüzdelik dilim arasında olduğundan ikinci ondalık dilimde yer alır.
- Veri değeri 68 %20 ila %30 yüzdelik dilim arasında olduğundan üçüncü ondalık dilimde yer alır.
Ve benzeri.
Ek kaynaklar
R’de yüzdelikler nasıl hesaplanır
R’de çeyrekler nasıl hesaplanır
R’de frekans tabloları nasıl oluşturulur