Jak korzystać ze podsumowania procedur w sas-ie (z przykładami)
Możesz użyć Podsumowanie procedury w SAS-ie, aby szybko obliczyć następującestatystyki opisowe dla jednej lub większej liczby zmiennych w zbiorze danych:
- N : Całkowita liczba obserwacji
- MIN : Wartość minimalna
- MAX : Wartość maksymalna
- ŚREDNIA : Średnia
- STD : Odchylenie standardowe
Poniższe przykłady pokazują, jak używać tej procedury z wbudowanym zbiorem danych SAS o nazwie Fish , który zawiera różne pomiary dla 159 różnych ryb złowionych w jeziorze w Finlandii.
Możemy użyć proc print do wyświetlenia pierwszych 10 obserwacji tego zbioru danych:
/*view first 10 observations from Fish dataset*/ proc print data =sashelp.Fish( obs = 10 ); run ;
Powiązane: Jak rozpoznać wartości odstające w SAS-ie
Przykład 1: Podsumowanie procedury ze zmienną
Możemy użyć poniższego kodu do obliczenia statystyk opisowych dla zmiennej Waga:
/*calculate descriptive statistics for Weight variable*/
proc summary data =sashelp.Fish;
var Weight ;
output out =summaryWeight;
run ;
/*print output dataset*/
proc print data =summaryWeight;
Oto jak interpretować tabelę wyników:
- _TYPE_: Ta kolumna wskazuje, czy każdy wiersz w zbiorze danych został użyty do obliczenia statystyk opisowych. 0 = Każda linia została wykorzystana.
- _FREQ_: Liczba wierszy używanych do obliczenia każdej statystyki opisowej.
- _STAT_: Nazwa statystyki opisowej.
- Waga: wartość liczbowa odpowiedniej statystyki opisowej.
Z wyniku możemy zobaczyć:
- Całkowita liczba obserwacji wyniosła 158 .
- Minimalna wartość wagi wynosiła 0 .
- Maksymalna waga wynosiła 1650 .
- Średnia wartość masy ciała wyniosła 398,70 .
- Odchylenie standardowe wartości wag wyniosło 359,09 .
Z tych pięciu wartości możemy uzyskać dość dobre zrozumienie rozkładu wartości zmiennej Waga.
Przykład 2: Podsumowanie procesu z wieloma zmiennymi
Aby obliczyć statystyki opisowe dla wielu zmiennych jednocześnie, po prostu wypisz wiele nazw zmiennych w instrukcji var .
Na przykład możemy użyć poniższego kodu do obliczenia statystyk opisowych dla zmiennych Waga i Wzrost:
/*calculate descriptive statistics for Weight and Height variables*/
proc summary data =sashelp.Fish;
var Weight Height ;
output out =summaryWeightHeight;
run ;
/*print output dataset*/
proc print data =summaryWeightHeight;
Na podstawie wyniku możemy zobaczyć pięć statystyk opisowych dotyczących masy ciała i wzrostu.
Przykład 3: Podsumowanie procesu z jedną zmienną pogrupowaną przez inną zmienną
Aby obliczyć statystyki opisowe dla zmiennej pogrupowanej według innej zmiennej, możemy skorzystać z instrukcji class .
Na przykład możemy użyć poniższego kodu do obliczenia statystyk opisowych dla wagi pogrupowanej według gatunków:
/*calculate descriptive statistics for Weight grouped by Species*/
proc summary data =sashelp.Fish;
var Weight ;
class Species;
output out =summaryWeightSpecies;
run ;
/*print output dataset*/
proc print data =summaryWeightSpecies;
Tabela wyników wyświetla statystyki opisowe dla każdego gatunku ryb.
Na przykład dla samej leszcze możemy zaobserwować następujące statystyki opisowe:
- Całkowita liczba obserwacji wyniosła 34 .
- Minimalna wartość masy wynosiła 242 .
- Maksymalna wartość wagi wynosiła 1000 .
- Średnia wartość masy wyniosła 626 .
- Odchylenie standardowe wartości wag wyniosło 206,60 .
Te statystyki opisowe możemy również obserwować dla wszystkich innych gatunków.
Dodatkowe zasoby
Poniższe samouczki wyjaśniają, jak wykonywać inne typowe zadania w SAS-ie:
Jak używać Proc Append w SAS-ie
Jak używać Proc Tabulate w SAS-ie
Jak obliczyć korelację w SAS-ie
Jak tworzyć tabele częstości w SAS-ie