R'de temel kural nasıl uygulanır?


Bazen 68-95-99,7 kuralı olarak da adlandırılan temel kural , normal dağılıma sahip belirli bir veri seti için şunları belirtir:

  • Veri değerlerinin %68’i ortalamanın bir standart sapması dahilindedir.
  • Veri değerlerinin %95’i ortalamanın iki standart sapması dahilindedir.
  • Veri değerlerinin %99,7’si ortalamanın üç standart sapması dahilindedir.

Bu derste, R’deki temel kuralın belirli bir veri kümesine nasıl uygulanacağını açıklıyoruz.

R’de temel kuralın uygulanması

R’deki pnorm() işlevi, normal dağılımın kümülatif yoğunluk fonksiyonunun değerini döndürür.

Bu işlev aşağıdaki temel sözdizimini kullanır:

pnorm(q, ortalama, sd)

Altın:

  • q : normal dağılımlı rastgele değişken değeri
  • ortalama : ortalama dağılım
  • sd : dağılımın standart sapması

Çeşitli standart sapmalar arasında kalan normal dağılım eğrisinin altındaki alanı bulmak için aşağıdaki sözdizimini kullanabiliriz:

 #find area under normal curve within 1 standard deviation of mean
pnorm(1) - pnorm(-1)

[1] 0.6826895

#find area under normal curve within 2 standard deviations of mean 
pnorm(2) - pnorm(-2)

[1] 0.9544997

#find area under normal curve within 3 standard deviations of mean 
pnorm(3) - pnorm(-3)

[1] 0.9973002

Sonuçtan şunu doğrulayabiliriz:

  • Veri değerlerinin %68’i ortalamanın bir standart sapması dahilindedir.
  • Veri değerlerinin %95’i ortalamanın iki standart sapması dahilindedir.
  • Veri değerlerinin %99,7’si ortalamanın üç standart sapması dahilindedir.

Aşağıdaki örnekler pratikte farklı veri kümeleriyle temel kuralın nasıl kullanılacağını göstermektedir.

Örnek 1: Ampirik Kuralın R’deki Veri Kümesine Uygulanması

Ortalaması 7 ve standart sapması 2,2 olan normal dağılmış bir veri setimiz olduğunu varsayalım.

Hangi değerlerin verinin %68, %95 ve %99,7’sini içerdiğini belirlemek için aşağıdaki kodu kullanabiliriz:

 #define mean and standard deviation values
mean=7
sd=2.2

#find which values contain 68% of data
mean-2.2; mean+2.2

[1] 4.8
[1] 9.2

#find which values contain 95% of data
mean-2*2.2; mean+2*2.2

[1] 2.6
[1] 11.4

#find which values contain 99.7% of data
mean-3*2.2; mean+3*2.2

[1] 0.4
[1] 13.6

Bu çıktıdan şunları görebiliriz:

  • Verilerin %68’i 4,8 ile 9,2 arasındadır
  • Verilerin %95’i 2,6 ile 11,4 arasındadır
  • Verilerin %99,7’si 0,4 ile 13,6 arasındadır

Örnek 2: Verilerin yüzde kaçının belirli değerler arasında kaldığını belirleyin

Ortalaması 100 ve standart sapması 5 olan normal dağılmış bir veri setimiz olduğunu düşünün.

Bu dağılımda verilerin yüzde kaçının 99 ile 105 değerleri arasında olduğunu bilmek istediğimizi varsayalım.

Cevabı bulmak için pnorm( ) fonksiyonunu kullanabiliriz:

 #find area under normal curve between 99 and 105
pnorm(105, mean=100, sd=5) - pnorm(99, mean=100, sd=5)

[1] 0.4206045

Bu dağılım için verilerin %42,06’sının 99 ile 105 değerleri arasında kaldığını görüyoruz.

Ek kaynaklar

Excel’de temel kural nasıl uygulanır?
Temel kuralları uygulamada sorunlar
Başparmak Hesaplayıcı Kuralları

Yorum ekle

E-posta hesabınız yayımlanmayacak. Gerekli alanlar * ile işaretlenmişlerdir