Sas'ta prosedür özeti nasıl kullanılır (örneklerle)


Bir veri kümesindeki bir veya daha fazla değişkene ilişkin aşağıdaki tanımlayıcı istatistikleri hızlı bir şekilde hesaplamak için SAS’ta Prosedür Özeti’ni kullanabilirsiniz:

  • N : Toplam gözlem sayısı
  • MIN : Minimum değer
  • MAX : Maksimum değer
  • ORTALAMA : Ortalama
  • STD : Standart sapma

Aşağıdaki örnekler, bu prosedürün, Finlandiya’daki bir gölde yakalanan 159 farklı balık için çeşitli ölçümler içeren Fish adlı SAS yerleşik veri kümesiyle nasıl kullanılacağını göstermektedir.

Bu veri kümesinin ilk 10 gözlemini görüntülemek için proc print’i kullanabiliriz:

 /*view first 10 observations from Fish dataset*/
proc print data =sashelp.Fish( obs = 10 );

run ;

İlgili: SAS’ta Aykırı Değerler Nasıl Belirlenir?

Örnek 1: Değişkenli prosedürün özeti

Ağırlık değişkenine ilişkin tanımlayıcı istatistikleri hesaplamak için aşağıdaki kodu kullanabiliriz:

 /*calculate descriptive statistics for Weight variable*/
proc summary data =sashelp.Fish;
   var Weight ;
   output out =summaryWeight;
run ;

/*print output dataset*/
proc print data =summaryWeight; 

Çıktı tablosunu nasıl yorumlayacağınız aşağıda açıklanmıştır:

  • _TYPE_: Bu sütun, veri kümesindeki her satırın tanımlayıcı istatistikleri hesaplamak için kullanılıp kullanılmadığını gösterir. 0 = Her satır kullanıldı.
  • _FREQ_: Her bir tanımlayıcı istatistiği hesaplamak için kullanılan satır sayısı.
  • _STAT_: Tanımlayıcı istatistiğin adı.
  • Ağırlık: İlgili tanımlayıcı istatistiğin sayısal değeri.

Sonuçtan şunu görebiliriz:

  • Toplam gözlem sayısı 158 oldu.
  • Minimum ağırlık değeri 0’dı .
  • Maksimum ağırlık değeri 1.650 idi.
  • Ortalama ağırlık değeri ise 398,70 oldu.
  • Ağırlık değerlerinin standart sapması 359,09 oldu.

Bu beş değerden Weight değişkenine ait değerlerin dağılımını oldukça iyi anlayabiliriz.

Örnek 2: Çoklu Değişkenli Süreç Özeti

Birden fazla değişkenin tanımlayıcı istatistiklerini aynı anda hesaplamak için var ifadesinde birden fazla değişken adını listelemeniz yeterlidir.

Örneğin, Ağırlık ve Boy değişkenlerine ilişkin tanımlayıcı istatistikleri hesaplamak için aşağıdaki kodu kullanabiliriz:

 /*calculate descriptive statistics for Weight and Height variables*/
proc summary data =sashelp.Fish;
   var Weight Height ;
   output out =summaryWeightHeight;
run ;

/*print output dataset*/
proc print data =summaryWeightHeight; 

Sonuçta ağırlık ve boy için beş tanımlayıcı istatistiği görebiliriz.

Örnek 3: Bir değişkenin başka bir değişkene göre gruplandığı sürecin özeti

Başka bir değişkene göre gruplandırılmış bir değişkenin tanımlayıcı istatistiklerini hesaplamak için class ifadesini kullanabiliriz.

Örneğin, türlere göre gruplandırılmış ağırlığa ilişkin tanımlayıcı istatistikleri hesaplamak için aşağıdaki kodu kullanabiliriz:

 /*calculate descriptive statistics for Weight grouped by Species*/
proc summary data =sashelp.Fish;
   var Weight ;
   class Species;
   output out =summaryWeightSpecies;
run ;

/*print output dataset*/
proc print data =summaryWeightSpecies; 

Çıktı tablosu her balık türü için tanımlayıcı istatistikleri görüntüler.

Örneğin sadece Çipura balığı için aşağıdaki tanımlayıcı istatistikleri gözlemleyebiliriz:

  • Toplam gözlem sayısı 34’tür .
  • Minimum ağırlık değeri 242 idi.
  • Maksimum ağırlık değeri 1000 idi.
  • Ortalama ağırlık değeri 626 idi.
  • Ağırlık değerlerinin standart sapması 206,60 oldu.

Bu tanımlayıcı istatistikleri diğer tüm türler için de gözlemleyebiliyoruz.

Ek kaynaklar

Aşağıdaki eğitimlerde SAS’ta diğer ortak görevlerin nasıl gerçekleştirileceği açıklanmaktadır:

SAS’ta Proc Append nasıl kullanılır?
SAS’ta Proc Tabulate nasıl kullanılır?
SAS’ta korelasyon nasıl hesaplanır?
SAS’ta frekans tabloları nasıl oluşturulur?

Yorum ekle

E-posta hesabınız yayımlanmayacak. Gerekli alanlar * ile işaretlenmişlerdir