Jak korzystać ze podsumowania procedur w sas-ie (z przykładami)


Możesz użyć Podsumowanie procedury w SAS-ie, aby szybko obliczyć następującestatystyki opisowe dla jednej lub większej liczby zmiennych w zbiorze danych:

  • N : Całkowita liczba obserwacji
  • MIN : Wartość minimalna
  • MAX : Wartość maksymalna
  • ŚREDNIA : Średnia
  • STD : Odchylenie standardowe

Poniższe przykłady pokazują, jak używać tej procedury z wbudowanym zbiorem danych SAS o nazwie Fish , który zawiera różne pomiary dla 159 różnych ryb złowionych w jeziorze w Finlandii.

Możemy użyć proc print do wyświetlenia pierwszych 10 obserwacji tego zbioru danych:

 /*view first 10 observations from Fish dataset*/
proc print data =sashelp.Fish( obs = 10 );

run ;

Powiązane: Jak rozpoznać wartości odstające w SAS-ie

Przykład 1: Podsumowanie procedury ze zmienną

Możemy użyć poniższego kodu do obliczenia statystyk opisowych dla zmiennej Waga:

 /*calculate descriptive statistics for Weight variable*/
proc summary data =sashelp.Fish;
   var Weight ;
   output out =summaryWeight;
run ;

/*print output dataset*/
proc print data =summaryWeight; 

Oto jak interpretować tabelę wyników:

  • _TYPE_: Ta kolumna wskazuje, czy każdy wiersz w zbiorze danych został użyty do obliczenia statystyk opisowych. 0 = Każda linia została wykorzystana.
  • _FREQ_: Liczba wierszy używanych do obliczenia każdej statystyki opisowej.
  • _STAT_: Nazwa statystyki opisowej.
  • Waga: wartość liczbowa odpowiedniej statystyki opisowej.

Z wyniku możemy zobaczyć:

  • Całkowita liczba obserwacji wyniosła 158 .
  • Minimalna wartość wagi wynosiła 0 .
  • Maksymalna waga wynosiła 1650 .
  • Średnia wartość masy ciała wyniosła 398,70 .
  • Odchylenie standardowe wartości wag wyniosło 359,09 .

Z tych pięciu wartości możemy uzyskać dość dobre zrozumienie rozkładu wartości zmiennej Waga.

Przykład 2: Podsumowanie procesu z wieloma zmiennymi

Aby obliczyć statystyki opisowe dla wielu zmiennych jednocześnie, po prostu wypisz wiele nazw zmiennych w instrukcji var .

Na przykład możemy użyć poniższego kodu do obliczenia statystyk opisowych dla zmiennych Waga i Wzrost:

 /*calculate descriptive statistics for Weight and Height variables*/
proc summary data =sashelp.Fish;
   var Weight Height ;
   output out =summaryWeightHeight;
run ;

/*print output dataset*/
proc print data =summaryWeightHeight; 

Na podstawie wyniku możemy zobaczyć pięć statystyk opisowych dotyczących masy ciała i wzrostu.

Przykład 3: Podsumowanie procesu z jedną zmienną pogrupowaną przez inną zmienną

Aby obliczyć statystyki opisowe dla zmiennej pogrupowanej według innej zmiennej, możemy skorzystać z instrukcji class .

Na przykład możemy użyć poniższego kodu do obliczenia statystyk opisowych dla wagi pogrupowanej według gatunków:

 /*calculate descriptive statistics for Weight grouped by Species*/
proc summary data =sashelp.Fish;
   var Weight ;
   class Species;
   output out =summaryWeightSpecies;
run ;

/*print output dataset*/
proc print data =summaryWeightSpecies; 

Tabela wyników wyświetla statystyki opisowe dla każdego gatunku ryb.

Na przykład dla samej leszcze możemy zaobserwować następujące statystyki opisowe:

  • Całkowita liczba obserwacji wyniosła 34 .
  • Minimalna wartość masy wynosiła 242 .
  • Maksymalna wartość wagi wynosiła 1000 .
  • Średnia wartość masy wyniosła 626 .
  • Odchylenie standardowe wartości wag wyniosło 206,60 .

Te statystyki opisowe możemy również obserwować dla wszystkich innych gatunków.

Dodatkowe zasoby

Poniższe samouczki wyjaśniają, jak wykonywać inne typowe zadania w SAS-ie:

Jak używać Proc Append w SAS-ie
Jak używać Proc Tabulate w SAS-ie
Jak obliczyć korelację w SAS-ie
Jak tworzyć tabele częstości w SAS-ie

Dodaj komentarz

Twój adres e-mail nie zostanie opublikowany. Wymagane pola są oznaczone *