R'de temel kural nasıl uygulanır?
Bazen 68-95-99,7 kuralı olarak da adlandırılan temel kural , normal dağılıma sahip belirli bir veri seti için şunları belirtir:
- Veri değerlerinin %68’i ortalamanın bir standart sapması dahilindedir.
- Veri değerlerinin %95’i ortalamanın iki standart sapması dahilindedir.
- Veri değerlerinin %99,7’si ortalamanın üç standart sapması dahilindedir.
Bu derste, R’deki temel kuralın belirli bir veri kümesine nasıl uygulanacağını açıklıyoruz.
R’de temel kuralın uygulanması
R’deki pnorm() işlevi, normal dağılımın kümülatif yoğunluk fonksiyonunun değerini döndürür.
Bu işlev aşağıdaki temel sözdizimini kullanır:
pnorm(q, ortalama, sd)
Altın:
- q : normal dağılımlı rastgele değişken değeri
- ortalama : ortalama dağılım
- sd : dağılımın standart sapması
Çeşitli standart sapmalar arasında kalan normal dağılım eğrisinin altındaki alanı bulmak için aşağıdaki sözdizimini kullanabiliriz:
#find area under normal curve within 1 standard deviation of mean pnorm(1) - pnorm(-1) [1] 0.6826895 #find area under normal curve within 2 standard deviations of mean pnorm(2) - pnorm(-2) [1] 0.9544997 #find area under normal curve within 3 standard deviations of mean pnorm(3) - pnorm(-3) [1] 0.9973002
Sonuçtan şunu doğrulayabiliriz:
- Veri değerlerinin %68’i ortalamanın bir standart sapması dahilindedir.
- Veri değerlerinin %95’i ortalamanın iki standart sapması dahilindedir.
- Veri değerlerinin %99,7’si ortalamanın üç standart sapması dahilindedir.
Aşağıdaki örnekler pratikte farklı veri kümeleriyle temel kuralın nasıl kullanılacağını göstermektedir.
Örnek 1: Ampirik Kuralın R’deki Veri Kümesine Uygulanması
Ortalaması 7 ve standart sapması 2,2 olan normal dağılmış bir veri setimiz olduğunu varsayalım.
Hangi değerlerin verinin %68, %95 ve %99,7’sini içerdiğini belirlemek için aşağıdaki kodu kullanabiliriz:
#define mean and standard deviation values mean=7 sd=2.2 #find which values contain 68% of data mean-2.2; mean+2.2 [1] 4.8 [1] 9.2 #find which values contain 95% of data mean-2*2.2; mean+2*2.2 [1] 2.6 [1] 11.4 #find which values contain 99.7% of data mean-3*2.2; mean+3*2.2 [1] 0.4 [1] 13.6
Bu çıktıdan şunları görebiliriz:
- Verilerin %68’i 4,8 ile 9,2 arasındadır
- Verilerin %95’i 2,6 ile 11,4 arasındadır
- Verilerin %99,7’si 0,4 ile 13,6 arasındadır
Örnek 2: Verilerin yüzde kaçının belirli değerler arasında kaldığını belirleyin
Ortalaması 100 ve standart sapması 5 olan normal dağılmış bir veri setimiz olduğunu düşünün.
Bu dağılımda verilerin yüzde kaçının 99 ile 105 değerleri arasında olduğunu bilmek istediğimizi varsayalım.
Cevabı bulmak için pnorm( ) fonksiyonunu kullanabiliriz:
#find area under normal curve between 99 and 105
pnorm(105, mean=100, sd=5) - pnorm(99, mean=100, sd=5)
[1] 0.4206045
Bu dağılım için verilerin %42,06’sının 99 ile 105 değerleri arasında kaldığını görüyoruz.
Ek kaynaklar
Excel’de temel kural nasıl uygulanır?
Temel kuralları uygulamada sorunlar
Başparmak Hesaplayıcı Kuralları