Sas: jak używać jednowymiarowej proc do testowania normalności


Możesz użyć proc univariate w SAS-ie z instrukcją normal , aby przeprowadzić wiele testów normalności zmiennej w zbiorze danych.

W tej procedurze zastosowano następującą podstawową składnię:

 proc univariate data =my_data normal ;
    var my_variable;
run ;

Poniższy przykład pokazuje, jak zastosować tę procedurę w praktyce.

Przykład: Proc Univariate do testowania normalności w SAS

Załóżmy, że mamy następujący zbiór danych w SAS-ie, który zawiera informacje o różnych koszykarzach:

 /*create dataset*/
data my_data;
    input team $pointsrebounds;
    datalines ;
At 12 8
At 12 8
At 12 8
At 23 9
At 20 12
At 14 7
At 14 7
B 20 2
B 20 5
B 29 4
B 14 7
B 20 2
B 20 2
B 20 5
;
run ;

/*view dataset*/
proc print data =my_data;

Możemy użyć proc jednowymiarowej z instrukcją normal , aby przeprowadzić różne testy normalności zmiennej punkty :

 proc univariate data =my_data normal ;
    var points;
run ;

W wyniku zostanie wyświetlonych kilka tabel, ale ta zatytułowana Testy normalności zawiera wyniki testów normalności:

Jednoczynnikowy test normalności SAS proc

Domyślnie SAS wykonuje cztery testy normalności i wyświetla każdą statystykę testów oraz odpowiadające im wartości p:

  • Test Shapiro-Wilka : W = 0,867, p = 0,0383
  • Test Kołmogorowa-Smirnowa : D = 0,237, p = 0,0318
  • Test Cramera-vona Misesa : W-Sq = 0,152, p = 0,0200
  • Test Andersona-Darlinga : A-Sq = 0,847, p = 0,0223

Każdy test normalności wykorzystuje następujące hipotezy zerowe i alternatywne:

  • H 0 : Dane mają rozkład normalny.
  • H A : Dane nie mają rozkładu normalnego.

Ponieważ wartość p dla każdego testu normalności jest mniejsza niż 0,05, odrzucilibyśmy hipotezę zerową dla każdego testu normalności.

Oznacza to, że istnieją wystarczające dowody, aby stwierdzić, że zmienna punktowa nie ma rozkładu normalnego.

Pamiętaj, że możesz także utworzyć histogram z nałożoną krzywą normalną w celu wizualizacji rozkładu wartości zmiennej punktowej :

 proc univariate data =my_data;
    histogram points / normal ;
run ; 

Histogram pokazuje nam, że rozkład wartości nie pokrywa się zbyt dobrze z krzywą normalną, co zgadza się z wynikami przeprowadzonych przez nas testów normalności.

Dodatkowe zasoby

Poniższe samouczki wyjaśniają, jak wykonywać inne typowe zadania w SAS-ie:

Jak korzystać ze podsumowania procedur w SAS-ie
Jak używać Proc Tabulate w SAS-ie
Jak korzystać z sortowania Proc w SAS-ie

Dodaj komentarz

Twój adres e-mail nie zostanie opublikowany. Wymagane pola są oznaczone *