Sas'ta qq grafiği nasıl oluşturulur


Bir veri kümesinin potansiyel olarak teorik bir dağılımdan gelip gelmediğini değerlendirmek için “kantil-nicelik” kelimesinin kısaltması olan bir QQ grafiği kullanılır.

Çoğu durumda bu tür çizim, bir veri kümesinin normal dağılıma uyup uymadığını belirlemek için kullanılır.

Veriler normal olarak dağılıyorsa, QQ grafiğindeki noktalar düz bir çapraz çizgi üzerinde yer alacaktır.

Tersine, grafikteki noktalar düz bir çapraz çizgiden ne kadar belirgin biçimde saparsa, veri setinin normal bir dağılım izleme olasılığı da o kadar az olur.

SAS’ta bir QQ grafiği oluşturmanın en kolay yolu PROC UNIVARIATE deyimini QQPLOT deyimiyle birlikte kullanmaktır:

 proc univariate data =my_data noprint ;
   qqplot my_variable;
run ;

Aşağıdaki örnekler bu sözdiziminin pratikte nasıl kullanılacağını göstermektedir.

Not : PROC UNIVARIATE deyimi tarafından otomatik olarak oluşturulan diğer tüm özet istatistikleri ve tabloları kaldırmak için NOPRINT deyimini kullanırız.

Örnek 1: Normal veriler için SAS’ta bir QQ grafiği oluşturma

Aşağıdaki kod, ortalaması 10 ve standart sapması 2 olan normal dağılımdan oluşturulan 1000 gözlem içeren bir veri seti için QQ grafiğinin nasıl oluşturulacağını gösterir:

 /*generate 1000 values that follow normal distribution with mean 10 and sd 2 */
data normal_data;
    do i = 1 to 1000;
	x = 10 + 2* rannor (1);
        output ;
    end ;
run ;

/*create some plot*/
proc univariate data =normal_data noprint ;
   qqplot x;
run ; 

SAS'ta QQ grafiği

Noktaların çoğunlukla düz bir çapraz çizgi boyunca uzandığını ve kuyrukların her birinde bazı küçük sapmaların olduğunu görebiliriz.

Bu grafiğe dayanarak, bu veri kümesinin normal dağıldığını rahatlıkla varsayabiliriz.

Örnek 2: Normal olmayan veriler için QQ grafiği

Aşağıdaki kod, üstel dağılımdan oluşturulan 1000 gözlem içeren bir veri kümesi için QQ grafiğinin nasıl oluşturulacağını gösterir:

 /*generate 1000 values that follow an exponential distribution*/
data exp_data;
    do i = 1 to 1000;
	x = ranexp (1);
        output ;
    end ;
run ;

/*create some plot*/
proc univariate data =exp_data noprint ;
   qqplot x;
run ; 

Noktaların düz bir çapraz çizgiden önemli ölçüde saptığını görüyorum. Bu açıkça veri setinin normal dağılmadığını gösterir.

Verilerin üstel bir dağılım izlemesi gerektiğini belirttiğimiz göz önüne alındığında, bu mantıklı olmalıdır.

Ek kaynaklar

Aşağıdaki eğitimlerde SAS’ta diğer ortak görevlerin nasıl gerçekleştirileceği açıklanmaktadır:

SAS’ta Normallik Testi için Proc Univariate Nasıl Kullanılır
SAS’ta günlük dönüşümü nasıl gerçekleştirilir?
SAS’ta aykırı değerler nasıl belirlenir

Yorum ekle

E-posta hesabınız yayımlanmayacak. Gerekli alanlar * ile işaretlenmişlerdir