Jak obliczyć statystyki opisowe w sas-ie


Statystyki opisowe to wartości opisujące zbiór danych.

Pomagają nam zrozumieć, gdzie znajduje się środek zbioru danych, a także rozkład wartości w zbiorze danych.

Istnieją dwa popularne sposoby obliczania statystyk opisowych dla zmiennych w SAS-ie:

1. Użyj PROC MEANS do obliczenia statystyk podsumowujących

2. Użyj PROC UNIVARIATE do obliczenia szczegółowych statystyk opisowych

Poniższe przykłady pokazują, jak zastosować każdą metodę w praktyce z następującym zbiorem danych w SAS-ie:

 /*create dataset*/
data my_data;
    input team $points assists;
    datalines ;
At 10 2
At 17 5
At 17 6
At 18 3
At 15 0
B 10 2
B 14 5
B 13 4
B 29 0
B 25 2
C 12 1
C 30 1
C 34 3
C 12 4
C 11 7
;
run ;

/*view dataset*/
proc print data =my_data; 

Przykład 1. Użyj PROC MEANS do obliczenia statystyk podsumowujących

Poniższy kod pokazuje, jak używać PROC MEANS do obliczania statystyk podsumowujących dla zmiennej punktów w zbiorze danych:

 /*calculate summary statistics for points variable*/
proc means data =my_data;
    var points;
run ; 

statystyki opisowe w SAS przy użyciu PROC MEANS

Procedura PROC MEANS oblicza następujące statystyki opisowe:

  • N : Całkowita liczba obserwacji
  • Średnia : Średnia wartość punktów
  • Std Dev: odchylenie standardowe punktów
  • Minimum : Minimalna wartość punktów
  • Maksimum : Maksymalna wartość punktów

Należy również pamiętać, że instrukcji class można używać do obliczania statystyk opisowych dla jednej zmiennej, pogrupowanej według innej zmiennej.

Na przykład możemy użyć poniższego kodu do obliczenia statystyk podsumowujących dla zmiennej punktów , pogrupowanych według zmiennej zespołu :

 /*calculate summary statistics for points, grouped by team*/
proc means data =my_data;
    classteam ;
    var points;
run ; 

Dane wyjściowe wyświetlają statystyki podsumowujące dla zmiennej punktów , pogrupowane według każdej unikalnej wartości zespołu .

Przykład 2. Użyj PROC UNIVARIATE do obliczenia szczegółowych statystyk opisowych

Poniższy kod pokazuje, jak używać PROC UNIVARIATE do obliczania szczegółowych statystyk opisowych dla zmiennej punktów :

 /*calculate detailed descriptive statistics for points variable*/
proc univariate data =my_data;
    var points;
run ; 

Procedura PROC UNIVARIATE oblicza szczegółowe statystyki opisowe dla zmiennej punktowej , w tym średnią, medianę, modę, odchylenie standardowe, wariancję, zakres, rozstęp międzykwartylowy itp.

Możemy również użyć instrukcji class do obliczenia szczegółowych statystyk opisowych dla zmiennej punktów , pogrupowanych według zmiennej zespołu :

 /*calculate detailed descriptive statistics for points, grouped by team*/
proc univariate data =my_data;
    classteam ;
    var points;
run ;

Spowoduje to utworzenie trzech grup tabel wyjściowych, które wyświetlają szczegółowe statystyki opisowe dla zmiennej punktów , pogrupowane według unikalnych wartości zespołu .

Dodatkowe zasoby

Poniższe samouczki wyjaśniają, jak wykonywać inne typowe zadania w SAS-ie:

Jak tworzyć tabele częstości w SAS-ie
Jak obliczyć percentyle w SAS-ie
Jak tworzyć tabele przestawne w SAS-ie

Dodaj komentarz

Twój adres e-mail nie zostanie opublikowany. Wymagane pola są oznaczone *