Sas: proc univariate gebruiken voor normaliteitstests


U kunt proc univariate in SAS gebruiken met de normal- instructie om meerdere normaliteitstests uit te voeren op een variabele in een gegevensset.

Deze procedure gebruikt de volgende basissyntaxis:

 proc univariate data =my_data normal ;
    var my_variable;
run ;

Het volgende voorbeeld laat zien hoe u deze procedure in de praktijk kunt gebruiken.

Voorbeeld: Proc Univariate voor normaliteitstesten in SAS

Stel dat we de volgende dataset in SAS hebben die informatie bevat over verschillende basketbalspelers:

 /*create dataset*/
data my_data;
    input team $pointsrebounds;
    datalines ;
At 12 8
At 12 8
At 12 8
At 23 9
At 20 12
At 14 7
At 14 7
B 20 2
B 20 5
B 29 4
B 14 7
B 20 2
B 20 2
B 20 5
;
run ;

/*view dataset*/
proc print data =my_data;

We kunnen proc univariate gebruiken met de normale instructie om verschillende normaliteitstests uit te voeren op de puntenvariabele :

 proc univariate data =my_data normal ;
    var points;
run ;

Er worden verschillende tabellen weergegeven in het resultaat, maar de tabel met de titel Normaliteitstests bevat de resultaten van de normaliteitstests:

SAS proc univariate normaliteitstest

Standaard voert SAS vier normaliteitstests uit en geeft elk van hun teststatistieken en bijbehorende p-waarden weer:

  • Shapiro-Wilk-test : W = 0,867, p = 0,0383
  • Kolmogorov-Smirnov-test : D = .237, p = .0318
  • Cramer-von Mises-test : W-Sq = 0,152, p = 0,0200
  • Anderson-Darling-test : A-Sq = 0,847, p = 0,0223

Elke normaliteitstest gebruikt de volgende nul- en alternatieve hypothesen:

  • H 0 : Gegevens zijn normaal verdeeld.
  • H A : De gegevens zijn niet normaal verdeeld.

Omdat de p-waarde voor elke normaliteitstest kleiner is dan 0,05, zouden we de nulhypothese voor elke normaliteitstest verwerpen.

Dit betekent dat er voldoende bewijs is om te concluderen dat de puntenvariabele niet normaal verdeeld is.

Merk op dat u ook een histogram kunt maken met een normale curve eroverheen om de verdeling van de waarden van de puntenvariabele te visualiseren:

 proc univariate data =my_data;
    histogram points / normal ;
run ; 

Uit het histogram blijkt dat de verdeling van waarden niet zo goed de normale curve volgt, wat overeenkomt met de resultaten van de normaliteitstests die we hebben uitgevoerd.

Aanvullende bronnen

In de volgende zelfstudies wordt uitgelegd hoe u andere veelvoorkomende taken in SAS kunt uitvoeren:

Procedureoverzicht gebruiken in SAS
Proc-tabel gebruiken in SAS
Proc-collatie gebruiken in SAS

Einen Kommentar hinzufügen

Deine E-Mail-Adresse wird nicht veröffentlicht. Erforderliche Felder sind mit * markiert