Sas'ta proc tablosu nasıl kullanılır (örneklerle)
Bir veya daha fazla değişkene ilişkin tanımlayıcı istatistikleri tablo biçiminde hızlı bir şekilde görüntülemek için SAS’ta proc tabulate’i kullanabilirsiniz.
Aşağıdaki örnekler, 12 farklı basketbolcunun attığı toplam puanı gösteren aşağıdaki veri kümesiyle bu prosedürün nasıl kullanılacağını göstermektedir:
/*create dataset*/
data my_data;
input team $position $points;
datalines ;
A Guard 15
A Guard 12
A Guard 29
A Forward 13
A Forward 9
A Forward 16
B Guard 25
B Guard 20
C Guard 34
C Forward 19
C Forward 3
C Forward 8
;
run ;
/*view dataset*/
proc print data =my_data;
Örnek 1: Bir değişkenle Proc Tablolaması
Puan değişkenine ilişkin tanımlayıcı istatistikleri hesaplamak için aşağıdaki kodu kullanabiliriz:
/*create table that displays descriptive stats for points variable */
proc tabulate data =my_data;
var points;
table points * (N Min Q1 Median Mean Q3 Max);
run ;
Not : Parantez içindeki değerler, SAS’a noktalar için hangi tanımlayıcı istatistiklerin hesaplanacağını belirtir.
En sık kullanılan tanımlayıcı istatistiklerden bazıları şunlardır:
- N : Toplam gözlem sayısı
- Min : Minimum değer
- Q1 : İlk yüzdelik dilimin değeri (yani 25. yüzdelik dilim)
- Medyan : Medyan değer
- Ortalama : Ortalama değer
- S3 : Üçüncü yüzdelik dilimin değeri (yani 75. yüzdelik dilim)
- Maks : Maksimum değer
Sonuçtan şunu görebiliriz:
- Toplam gözlem sayısı 12’dir .
- Minimum puan değeri 3’tür .
- 25. yüzdelik dilimdeki puan sayısı 10,5’tir .
- Ortalama puan sayısı 15,5’tir .
- Ortalama puan sayısı 16,92’dir .
- 75. yüzdelik dilimdeki puan sayısı 22,5’tir .
- Maksimum puan sayısı 34’tür .
Bu beş değerden Weight değişkenine ait değerlerin dağılımını oldukça iyi anlayabiliriz.
Örnek 2: İki değişkenli Proc Tablolaması
Takım değişkenine göre gruplandırılmış puan değişkenine ilişkin tanımlayıcı istatistikleri hesaplamak için aşağıdaki kodu kullanabiliriz:
/*create table that displays descriptive stats for points, grouped by team */
proc tabulate data =my_data;
classteam ;
var points;
table team, points * (N Min Q1 Median Mean Q3 Max);
run ;
Ortaya çıkan tablo, üç takımın her biri için tanımlayıcı puan istatistiklerini gösterir.
Örneğin:
- A takımının 6 gözlemi vardır.
- A Takımı için minimum puan değeri 9’dur .
- A takımının 25. yüzdelik dilimdeki puanı 12’dir .
- A takımının ortalama puanı 14’tür .
Ve benzeri.
Örnek 3: Üç değişkenli Proc Tablosu
Takım ve pozisyon değişkenlerine göre gruplandırılmış puan değişkenine ilişkin tanımlayıcı istatistikleri hesaplamak için aşağıdaki kodu kullanabiliriz:
/*create table that shows descriptive stats for points, grouped by team and position */
proc tabulate data =my_data;
class team position;
var points;
table team, position *points* (N Min Q1 Median Mean Q3 Max);
run ;
Ortaya çıkan tablo, takıma ve konuma göre gruplandırılmış puanların tanımlayıcı istatistiklerini gösterir.
Takım “B” ve “Saldırgan” pozisyonuna ait hücrelerin boş olduğunu unutmayın çünkü Takım B’deki hiçbir oyuncu Hücumcu pozisyonuna sahip değildi.
Ek kaynaklar
Aşağıdaki eğitimlerde SAS’ta diğer ortak görevlerin nasıl gerçekleştirileceği açıklanmaktadır:
SAS’ta prosedür özeti nasıl kullanılır?
SAS’ta korelasyon nasıl hesaplanır?
SAS’ta frekans tabloları nasıl oluşturulur?
SAS’ta gruba göre kutu grafikleri nasıl oluşturulur?