Normalliği kontrol etmek için qq grafikleri nasıl kullanılır?
Bir veri kümesinin potansiyel olarak teorik bir dağılımdan gelip gelmediğini değerlendirmek için “kantil-nicelik” kelimesinin kısaltması olan bir QQ grafiği kullanılır.
Çoğu durumda bu tür çizim, bir veri kümesinin normal dağılıma uyup uymadığını belirlemek için kullanılır.
Veriler normal olarak dağılıyorsa, QQ grafiğindeki noktalar düz bir çapraz çizgi üzerinde yer alacaktır.
Tersine, grafikteki noktalar düz bir çapraz çizgiden ne kadar belirgin biçimde saparsa, veri setinin normal bir dağılım izleme olasılığı da o kadar az olur.
Aşağıdaki örnekler normalliği kontrol etmek için R’de QQ grafiklerinin nasıl oluşturulacağını gösterir.
Örnek 1: Normal veriler için QQ grafiği
Aşağıdaki kod, 200 gözlemle normal şekilde dağıtılmış bir veri kümesinin nasıl oluşturulacağını ve R’deki veri kümesi için bir QQ grafiğinin nasıl oluşturulacağını gösterir:
#make this example reproducible set. seeds (1) #create some fake data that follows a normal distribution data <- rnorm(200) #create QQ plot qqnorm(data) qqline(data)
Noktaların esas olarak düz çapraz çizgi boyunca uzandığını ve her bir kuyruk boyunca bazı küçük sapmalar olduğunu görebiliriz.
Bu grafiğe dayanarak, bu veri kümesinin normal dağıldığını rahatlıkla varsayabiliriz.
Örnek 2: Normal olmayan veriler için QQ grafiği
Aşağıdaki kod, 200 gözlemle üstel bir dağılım izleyen bir veri kümesi için QQ grafiğinin nasıl oluşturulacağını gösterir:
#make this example reproducible set. seeds (1) #create some fake data that follows an exponential distribution data <- rexp(200, rate=3) #create QQ plot qqnorm(data) qqline(data)
Noktaların diyagonal çizgiden önemli ölçüde saptığını görüyoruz. Bu açıkça veri setinin normal dağılmadığını gösterir.
Verilerin üstel bir dağılım izlemesi gerektiğini belirttiğimiz göz önüne alındığında, bu mantıklı olmalıdır.
QQ grafikleri ve histogramları
QQ grafiklerinin, bir veri kümesinin normal dağılıma uyup uymadığını görsel olarak kontrol etmenin bir yolu olduğuna dikkat edilmelidir.
Normalliği görsel olarak kontrol etmenin başka bir yolu da veri setinin histogramını oluşturmaktır. Veriler histogramda yaklaşık olarak çan eğrisi şeklini takip ediyorsa, veri setinin normal dağıldığını varsayabiliriz.
Örneğin, önceden normal şekilde dağıtılan veri seti için histogramın nasıl oluşturulacağı aşağıda açıklanmıştır:
#make this example reproducible set. seeds (1) #create some fake data that follows a normal distribution data <- rnorm(200) #create a histogram to visualize the distribution hist(data)
Üstel bir önsel dağılım izleyen veri kümesi için bir histogramın nasıl oluşturulacağı aşağıda açıklanmıştır:
#make this example reproducible set. seeds (1) #create some fake data that follows an exponential distribution data <- rexp(200, rate=3) #create a histogram to visualize the distribution hist(data)
Histogramın hiç de çan eğrisine benzemediğini görüyoruz, bu da verilerin normal bir dağılım izlemediğini açıkça gösteriyor.
Ek kaynaklar
İstatistikte normallik varsayımı nedir?
R’de QQ grafiği nasıl oluşturulur
Excel’de QQ Grafiği Nasıl Oluşturulur
Python’da QQ Grafiği Nasıl Oluşturulur