Jak obliczyć skośność i kurtozę w sas
W statystyce skośność i kurtoza to dwa sposoby pomiaru kształtu rozkładu.
Skośność mierzy asymetrię rozkładu.
- Ujemna skośność wskazuje, że ogon znajduje się po lewej stronie rozkładu.
- Dodatnie odchylenie wskazuje, że ogon znajduje się po prawej stronie rozkładu.
- Wartość zero oznacza, że w rozkładzie nie ma asymetrii, co oznacza, że rozkład jest doskonale symetryczny.
Kurtoza mierzy, czy rozkład jest ciężki czy lekki w porównaniu z rozkładem normalnym .
- Kurtoza rozkładu normalnego wynosi 0.
- Jeśli dany rozkład ma kurtozę mniejszą niż 0, nazywa się go playkurtycznym , co oznacza, że ma tendencję do tworzenia mniejszej liczby i mniej skrajnych wartości odstających niż rozkład normalny.
- Jeśli dany rozkład ma kurtozę większą niż 0, nazywa się go leptokurtycznym , co oznacza, że ma tendencję do tworzenia większej liczby wartości odstających niż rozkład normalny.
Aby obliczyć skośność i kurtozę zmiennych w SAS, możesz użyć instrukcji SKEWNESS i KURTOSIS w PROC MEANS .
Poniższy przykład pokazuje, jak w praktyce wykorzystać te instrukcje.
Przykład: Obliczanie skośności i kurtozy w SAS
Załóżmy, że mamy następujący zbiór danych w SAS-ie, który zawiera informacje o różnych koszykarzach:
/*create dataset*/ data my_data; input team $points assists; datalines ; At 10 2 At 17 5 At 17 6 At 18 3 At 15 0 B 10 2 B 14 5 B 13 4 B 29 0 B 25 2 C 12 1 C 30 1 C 34 3 C 12 4 C 11 7 ; run ; /*view dataset*/ proc print data =my_data;
Możemy użyć PROC MEANS z instrukcjami SKEWNESS i KURTOSIS , aby obliczyć skośność i kurtozę każdej zmiennej numerycznej w zbiorze danych:
/*calculate skewness and kurtosis for each numeric variable*/ proc means data =my_data SKEWNESS KURTOSIS ; run ;
Tabela wyjściowa wyświetla wartości skośności i kurtozy dla każdej zmiennej numerycznej w zbiorze danych:
(1) punkty
- Zmienna punktów ma skośność 1,009 . Ponieważ wartość ta jest większa od 0, oznacza to, że ogon znajduje się po prawej stronie rozkładu.
- Zmienna punkty ma kurtozę wynoszącą -0,299 . Ponieważ wartość ta jest mniejsza niż 0, oznacza to, że rozkład ma nieco mniej wartości odstających i mniej wartości ekstremalnych niż rozkład normalny.
(2) pomoc
- Zmienna asystująca ma skośność 0,304 . Ponieważ wartość ta jest większa od 0, oznacza to, że ogon znajduje się po prawej stronie rozkładu.
- Zmienna wsparcia ma kurtozę -0,782 . Ponieważ wartość ta jest mniejsza niż 0, oznacza to, że rozkład ma mniej wartości odstających i mniej wartości ekstremalnych niż rozkład normalny.
Aby zwizualizować rozkład wartości dla każdej zmiennej numerycznej w zbiorze danych, możesz użyć PROC UNIVARIATE do utworzenia histogramów dla zmiennych punktowych i pomocniczych:
/*create histograms for points and assists variables*/
proc univariate data =my_data;
var points assists;
histogram points assists;
run ;
Daje to następujący histogram dla zmiennej punktów :
Oraz następujący histogram dla zmiennej pomocniczej :
Dodatkowe zasoby
Poniższe samouczki wyjaśniają, jak wykonywać inne typowe zadania w SAS-ie:
Jak obliczyć statystyki opisowe w SAS-ie
Jak tworzyć tabele częstości w SAS-ie
Jak obliczyć percentyle w SAS-ie
Jak tworzyć tabele przestawne w SAS-ie