Normalliği kontrol etmek için qq grafikleri nasıl kullanılır?


Bir veri kümesinin potansiyel olarak teorik bir dağılımdan gelip gelmediğini değerlendirmek için “kantil-nicelik” kelimesinin kısaltması olan bir QQ grafiği kullanılır.

Çoğu durumda bu tür çizim, bir veri kümesinin normal dağılıma uyup uymadığını belirlemek için kullanılır.

Veriler normal olarak dağılıyorsa, QQ grafiğindeki noktalar düz bir çapraz çizgi üzerinde yer alacaktır.

Tersine, grafikteki noktalar düz bir çapraz çizgiden ne kadar belirgin biçimde saparsa, veri setinin normal bir dağılım izleme olasılığı da o kadar az olur.

Aşağıdaki örnekler normalliği kontrol etmek için R’de QQ grafiklerinin nasıl oluşturulacağını gösterir.

Örnek 1: Normal veriler için QQ grafiği

Aşağıdaki kod, 200 gözlemle normal şekilde dağıtılmış bir veri kümesinin nasıl oluşturulacağını ve R’deki veri kümesi için bir QQ grafiğinin nasıl oluşturulacağını gösterir:

 #make this example reproducible
set. seeds (1)

#create some fake data that follows a normal distribution
data <- rnorm(200)

#create QQ plot
qqnorm(data)
qqline(data)

Noktaların esas olarak düz çapraz çizgi boyunca uzandığını ve her bir kuyruk boyunca bazı küçük sapmalar olduğunu görebiliriz.

Bu grafiğe dayanarak, bu veri kümesinin normal dağıldığını rahatlıkla varsayabiliriz.

Örnek 2: Normal olmayan veriler için QQ grafiği

Aşağıdaki kod, 200 gözlemle üstel bir dağılım izleyen bir veri kümesi için QQ grafiğinin nasıl oluşturulacağını gösterir:

 #make this example reproducible
set. seeds (1)

#create some fake data that follows an exponential distribution
data <- rexp(200, rate=3)

#create QQ plot
qqnorm(data)
qqline(data)

Noktaların diyagonal çizgiden önemli ölçüde saptığını görüyoruz. Bu açıkça veri setinin normal dağılmadığını gösterir.

Verilerin üstel bir dağılım izlemesi gerektiğini belirttiğimiz göz önüne alındığında, bu mantıklı olmalıdır.

QQ grafikleri ve histogramları

QQ grafiklerinin, bir veri kümesinin normal dağılıma uyup uymadığını görsel olarak kontrol etmenin bir yolu olduğuna dikkat edilmelidir.

Normalliği görsel olarak kontrol etmenin başka bir yolu da veri setinin histogramını oluşturmaktır. Veriler histogramda yaklaşık olarak çan eğrisi şeklini takip ediyorsa, veri setinin normal dağıldığını varsayabiliriz.

Örneğin, önceden normal şekilde dağıtılan veri seti için histogramın nasıl oluşturulacağı aşağıda açıklanmıştır:

 #make this example reproducible
set. seeds (1)

#create some fake data that follows a normal distribution
data <- rnorm(200)

#create a histogram to visualize the distribution
hist(data) 

Üstel bir önsel dağılım izleyen veri kümesi için bir histogramın nasıl oluşturulacağı aşağıda açıklanmıştır:

 #make this example reproducible
set. seeds (1)

#create some fake data that follows an exponential distribution
data <- rexp(200, rate=3)

#create a histogram to visualize the distribution
hist(data) 

Histogramın hiç de çan eğrisine benzemediğini görüyoruz, bu da verilerin normal bir dağılım izlemediğini açıkça gösteriyor.

Ek kaynaklar

İstatistikte normallik varsayımı nedir?
R’de QQ grafiği nasıl oluşturulur
Excel’de QQ Grafiği Nasıl Oluşturulur
Python’da QQ Grafiği Nasıl Oluşturulur

Yorum ekle

E-posta hesabınız yayımlanmayacak. Gerekli alanlar * ile işaretlenmişlerdir