Sas'ta tanımlayıcı istatistikler nasıl hesaplanır?


Tanımlayıcı istatistikler bir veri kümesini tanımlayan değerlerdir.

Veri setindeki değerlerin dağılımının yanı sıra veri setinin merkezinin nerede olduğunu anlamamıza da yardımcı olurlar.

SAS’taki değişkenlere ilişkin tanımlayıcı istatistikleri hesaplamanın iki yaygın yolu vardır:

1. Özet istatistikleri hesaplamak için PROC MEANS’ı kullanın

2. Ayrıntılı tanımlayıcı istatistikleri hesaplamak için PROC UNIVARIATE’i kullanın

Aşağıdaki örnekler, SAS’ta aşağıdaki veri kümesiyle her yöntemin pratikte nasıl kullanılacağını gösterir:

 /*create dataset*/
data my_data;
    input team $points assists;
    datalines ;
At 10 2
At 17 5
At 17 6
At 18 3
At 15 0
B 10 2
B 14 5
B 13 4
B 29 0
B 25 2
C 12 1
C 30 1
C 34 3
C 12 4
C 11 7
;
run ;

/*view dataset*/
proc print data =my_data; 

Örnek 1. Özet istatistikleri hesaplamak için PROC MEANS’ı kullanın

Aşağıdaki kod, veri kümesindeki puan değişkenine ilişkin özet istatistikleri hesaplamak için PROC MEANS’ın nasıl kullanılacağını gösterir:

 /*calculate summary statistics for points variable*/
proc means data =my_data;
    var points;
run ; 

PROC MEANS kullanılarak SAS'ta tanımlayıcı istatistikler

PROC MEANS prosedürü aşağıdaki tanımlayıcı istatistikleri hesaplar:

  • N : Toplam gözlem sayısı
  • Ortalama : Puanların ortalama değeri
  • Std Dev: noktaların standart sapması
  • Minimum : Puanların minimum değeri
  • Maksimum : Puanların maksimum değeri

Ayrıca, başka bir değişkene göre gruplandırılmış bir değişkene ilişkin tanımlayıcı istatistikleri hesaplamak için class ifadesini kullanabileceğinizi de unutmayın.

Örneğin, takım değişkenine göre gruplandırılmış puan değişkenine ilişkin özet istatistikleri hesaplamak için aşağıdaki kodu kullanabiliriz:

 /*calculate summary statistics for points, grouped by team*/
proc means data =my_data;
    classteam ;
    var points;
run ; 

Çıktı, benzersiz takım değerlerinin her birine göre gruplandırılmış olarak puan değişkenine ilişkin özet istatistikleri görüntüler .

Örnek 2. Ayrıntılı tanımlayıcı istatistikleri hesaplamak için PROC UNIVARIATE’i kullanın

Aşağıdaki kod, puan değişkenine ilişkin ayrıntılı tanımlayıcı istatistikleri hesaplamak için PROC UNIVARIATE’in nasıl kullanılacağını gösterir:

 /*calculate detailed descriptive statistics for points variable*/
proc univariate data =my_data;
    var points;
run ; 

PROC UNIVARIATE prosedürü, nokta değişkeni için ortalama, medyan, mod, standart sapma, varyans, aralık, çeyrekler arası aralık vb. dahil olmak üzere ayrıntılı tanımlayıcı istatistikleri hesaplar.

Takım değişkenine göre gruplandırılan puan değişkenine yönelik bu ayrıntılı tanımlayıcı istatistikleri hesaplamak için class ifadesini de kullanabiliriz:

 /*calculate detailed descriptive statistics for points, grouped by team*/
proc univariate data =my_data;
    classteam ;
    var points;
run ;

Bu, her bir takımın benzersiz değerlerine göre gruplandırılmış, puan değişkeni için ayrıntılı tanımlayıcı istatistikleri görüntüleyen üç grup çıktı tablosu üretecektir.

Ek kaynaklar

Aşağıdaki eğitimlerde SAS’ta diğer ortak görevlerin nasıl gerçekleştirileceği açıklanmaktadır:

SAS’ta frekans tabloları nasıl oluşturulur?
SAS’ta yüzdelikler nasıl hesaplanır?
SAS’ta PivotTable’lar Nasıl Oluşturulur

Yorum ekle

E-posta hesabınız yayımlanmayacak. Gerekli alanlar * ile işaretlenmişlerdir