Sas'ta çarpıklık ve basıklık nasıl hesaplanır?
İstatistikte çarpıklık ve basıklık bir dağılımın şeklini ölçmenin iki yoludur.
Çarpıklık bir dağılımın asimetrisini ölçer.
- Negatif çarpıklık, kuyruğun dağılımın sol tarafında olduğunu gösterir.
- Pozitif bir çarpıklık, kuyruğun dağılımın sağ tarafında olduğunu gösterir.
- Sıfır değeri, dağılımda asimetri olmadığını, yani dağılımın tamamen simetrik olduğunu gösterir.
Basıklık , bir dağılımın normal dağılıma göre ağır mı yoksa hafif kuyruklu mu olduğunu ölçer.
- Normal dağılımın basıklığı 0’dır.
- Belirli bir dağılımın basıklığı 0’dan küçükse buna playkurtic denir, bu da normal dağılıma göre giderek daha az uç değerler üretme eğiliminde olduğu anlamına gelir.
- Belirli bir dağılımın basıklığı 0’dan büyükse buna leptokurtik denir, bu da normal dağılımdan daha fazla aykırı değer üretme eğiliminde olduğu anlamına gelir.
SAS’ta değişkenlerin çarpıklık ve basıklığını hesaplamak için PROC MEANS’teki SKEWNESS ve KURTOSIS ifadelerini kullanabilirsiniz.
Aşağıdaki örnek bu talimatların pratikte nasıl kullanılacağını göstermektedir.
Örnek: SAS’ta Çarpıklık ve Basıklığın Hesaplanması
SAS’ta çeşitli basketbol oyuncuları hakkında bilgi içeren aşağıdaki veri kümesine sahip olduğumuzu varsayalım:
/*create dataset*/ data my_data; input team $points assists; datalines ; At 10 2 At 17 5 At 17 6 At 18 3 At 15 0 B 10 2 B 14 5 B 13 4 B 29 0 B 25 2 C 12 1 C 30 1 C 34 3 C 12 4 C 11 7 ; run ; /*view dataset*/ proc print data =my_data;
Veri kümesindeki her sayısal değişkenin çarpıklığını ve basıklığını hesaplamak için PROC ORTALAMALARINI SKEWNESS ve KURTOSIS ifadeleriyle birlikte kullanabiliriz:
/*calculate skewness and kurtosis for each numeric variable*/ proc means data =my_data SKEWNESS KURTOSIS ; run ;
Çıktı tablosu, veri kümesindeki her sayısal değişken için çarpıklık ve basıklık değerlerini görüntüler:
(1) puan
- Puan değişkeninin çarpıklığı 1,009’dur . Bu değer 0’dan büyük olduğu için kuyruğun dağılımın sağ tarafında olduğu anlamına gelir.
- Puan değişkeninin basıklığı -0,299’dur . Bu değerin 0’dan küçük olması, dağılımın normal dağılıma göre biraz daha az aykırı değerlere ve daha az uç değerlere sahip olduğu anlamına gelir.
(2) yardım
- Asist değişkeninin çarpıklığı 0,304’tür . Bu değer 0’dan büyük olduğu için kuyruğun dağılımın sağ tarafında olduğu anlamına gelir.
- Destek değişkeninin basıklığı -0,782’dir . Bu değerin 0’dan küçük olması, dağılımın normal dağılıma göre daha az aykırı ve daha az uç değerlere sahip olduğu anlamına gelir.
Veri kümesindeki her sayısal değişken için değerlerin dağılımını görselleştirmek amacıyla nokta ve yardımcı değişkenler için histogramlar oluşturmak üzere PROC UNIVARIATE’i kullanabilirsiniz:
/*create histograms for points and assists variables*/
proc univariate data =my_data;
var points assists;
histogram points assists;
run ;
Bu, puan değişkeni için aşağıdaki histogramı üretir:
Ve yardım değişkeni için aşağıdaki histogram:
Ek kaynaklar
Aşağıdaki eğitimlerde SAS’ta diğer ortak görevlerin nasıl gerçekleştirileceği açıklanmaktadır:
SAS’ta tanımlayıcı istatistikler nasıl hesaplanır?
SAS’ta frekans tabloları nasıl oluşturulur?
SAS’ta yüzdelikler nasıl hesaplanır?
SAS’ta PivotTable’lar Nasıl Oluşturulur