Hoe beschrijvende statistieken in sas te berekenen


Beschrijvende statistieken zijn waarden die een reeks gegevens beschrijven.

Ze helpen ons te begrijpen waar het centrum van de dataset zich bevindt, evenals de verdeling van waarden in de dataset.

Er zijn twee veelgebruikte manieren om beschrijvende statistieken voor variabelen in SAS te berekenen:

1. Gebruik PROC MEANS om samenvattende statistieken te berekenen

2. Gebruik PROC UNIVARIATE om gedetailleerde beschrijvende statistieken te berekenen

De volgende voorbeelden laten zien hoe u elke methode in de praktijk kunt gebruiken met de volgende gegevensset in SAS:

 /*create dataset*/
data my_data;
    input team $points assists;
    datalines ;
At 10 2
At 17 5
At 17 6
At 18 3
At 15 0
B 10 2
B 14 5
B 13 4
B 29 0
B 25 2
C 12 1
C 30 1
C 34 3
C 12 4
C 11 7
;
run ;

/*view dataset*/
proc print data =my_data; 

Voorbeeld 1. Gebruik PROC MEANS om samenvattende statistieken te berekenen

De volgende code laat zien hoe u PROC MEANS gebruikt om samenvattende statistieken te berekenen voor de puntenvariabele in de gegevensset:

 /*calculate summary statistics for points variable*/
proc means data =my_data;
    var points;
run ; 

beschrijvende statistieken in SAS met behulp van PROC MEANS

De PROC MEANS -procedure berekent de volgende beschrijvende statistieken:

  • N : Het totale aantal waarnemingen
  • Gemiddelde : de gemiddelde waarde van punten
  • Std Dev: de standaardafwijking van de punten
  • Minimum : De minimale waarde van punten
  • Maximaal : de maximale waarde van punten

Merk ook op dat u de class-instructie kunt gebruiken om beschrijvende statistieken voor één variabele te berekenen, gegroepeerd op een andere variabele.

We kunnen bijvoorbeeld de volgende code gebruiken om samenvattende statistieken te berekenen voor de puntenvariabele , gegroepeerd op de teamvariabele :

 /*calculate summary statistics for points, grouped by team*/
proc means data =my_data;
    classteam ;
    var points;
run ; 

De uitvoer geeft samenvattende statistieken weer voor de puntenvariabele , gegroepeerd op elk van de unieke teamwaarden .

Voorbeeld 2. Gebruik PROC UNIVARIATE om gedetailleerde beschrijvende statistieken te berekenen

De volgende code laat zien hoe u PROC UNIVARIATE gebruikt om gedetailleerde beschrijvende statistieken voor de puntenvariabele te berekenen:

 /*calculate detailed descriptive statistics for points variable*/
proc univariate data =my_data;
    var points;
run ; 

De PROC UNIVARIATE- procedure berekent gedetailleerde beschrijvende statistieken voor de puntvariabele , inclusief gemiddelde, mediaan, modus, standaarddeviatie, variantie, bereik, interkwartielbereik, enz.

We kunnen de class- instructie ook gebruiken om deze gedetailleerde beschrijvende statistieken voor de puntenvariabele te berekenen, gegroepeerd op de teamvariabele :

 /*calculate detailed descriptive statistics for points, grouped by team*/
proc univariate data =my_data;
    classteam ;
    var points;
run ;

Dit levert drie groepen uitvoertabellen op die gedetailleerde beschrijvende statistieken weergeven voor de puntenvariabele , gegroepeerd op elk van de unieke waarden van het team .

Aanvullende bronnen

In de volgende zelfstudies wordt uitgelegd hoe u andere veelvoorkomende taken in SAS kunt uitvoeren:

Hoe frequentietabellen in SAS te maken
Hoe percentielen in SAS te berekenen
Draaitabellen maken in SAS

Einen Kommentar hinzufügen

Deine E-Mail-Adresse wird nicht veröffentlicht. Erforderliche Felder sind mit * markiert