Jak obliczyć skośność i kurtozę w sas


W statystyce skośność i kurtoza to dwa sposoby pomiaru kształtu rozkładu.

Skośność mierzy asymetrię rozkładu.

  • Ujemna skośność wskazuje, że ogon znajduje się po lewej stronie rozkładu.
  • Dodatnie odchylenie wskazuje, że ogon znajduje się po prawej stronie rozkładu.
  • Wartość zero oznacza, że w rozkładzie nie ma asymetrii, co oznacza, że rozkład jest doskonale symetryczny.

Kurtoza mierzy, czy rozkład jest ciężki czy lekki w porównaniu z rozkładem normalnym .

  • Kurtoza rozkładu normalnego wynosi 0.
  • Jeśli dany rozkład ma kurtozę mniejszą niż 0, nazywa się go playkurtycznym , co oznacza, że ma tendencję do tworzenia mniejszej liczby i mniej skrajnych wartości odstających niż rozkład normalny.
  • Jeśli dany rozkład ma kurtozę większą niż 0, nazywa się go leptokurtycznym , co oznacza, że ma tendencję do tworzenia większej liczby wartości odstających niż rozkład normalny.

Aby obliczyć skośność i kurtozę zmiennych w SAS, możesz użyć instrukcji SKEWNESS i KURTOSIS w PROC MEANS .

Poniższy przykład pokazuje, jak w praktyce wykorzystać te instrukcje.

Przykład: Obliczanie skośności i kurtozy w SAS

Załóżmy, że mamy następujący zbiór danych w SAS-ie, który zawiera informacje o różnych koszykarzach:

 /*create dataset*/
data my_data;
    input team $points assists;
    datalines ;
At 10 2
At 17 5
At 17 6
At 18 3
At 15 0
B 10 2
B 14 5
B 13 4
B 29 0
B 25 2
C 12 1
C 30 1
C 34 3
C 12 4
C 11 7
;
run ;

/*view dataset*/
proc print data =my_data; 

Możemy użyć PROC MEANS z instrukcjami SKEWNESS i KURTOSIS , aby obliczyć skośność i kurtozę każdej zmiennej numerycznej w zbiorze danych:

 /*calculate skewness and kurtosis for each numeric variable*/
proc means data =my_data SKEWNESS KURTOSIS ;
run ; 

Tabela wyjściowa wyświetla wartości skośności i kurtozy dla każdej zmiennej numerycznej w zbiorze danych:

(1) punkty

  • Zmienna punktów ma skośność 1,009 . Ponieważ wartość ta jest większa od 0, oznacza to, że ogon znajduje się po prawej stronie rozkładu.
  • Zmienna punkty ma kurtozę wynoszącą -0,299 . Ponieważ wartość ta jest mniejsza niż 0, oznacza to, że rozkład ma nieco mniej wartości odstających i mniej wartości ekstremalnych niż rozkład normalny.

(2) pomoc

  • Zmienna asystująca ma skośność 0,304 . Ponieważ wartość ta jest większa od 0, oznacza to, że ogon znajduje się po prawej stronie rozkładu.
  • Zmienna wsparcia ma kurtozę -0,782 . Ponieważ wartość ta jest mniejsza niż 0, oznacza to, że rozkład ma mniej wartości odstających i mniej wartości ekstremalnych niż rozkład normalny.

Aby zwizualizować rozkład wartości dla każdej zmiennej numerycznej w zbiorze danych, możesz użyć PROC UNIVARIATE do utworzenia histogramów dla zmiennych punktowych i pomocniczych:

 /*create histograms for points and assists variables*/
proc univariate data =my_data;
    var points assists;
    histogram points assists;
run ;

Daje to następujący histogram dla zmiennej punktów :

Oraz następujący histogram dla zmiennej pomocniczej :

Dodatkowe zasoby

Poniższe samouczki wyjaśniają, jak wykonywać inne typowe zadania w SAS-ie:

Jak obliczyć statystyki opisowe w SAS-ie
Jak tworzyć tabele częstości w SAS-ie
Jak obliczyć percentyle w SAS-ie
Jak tworzyć tabele przestawne w SAS-ie

Dodaj komentarz

Twój adres e-mail nie zostanie opublikowany. Wymagane pola są oznaczone *