Sas での手順の概要の使用方法 (例付き)
SAS のプロシージャサマリを使用すると、データセット内の 1 つ以上の変数について次の記述統計を迅速に計算できます。
- N : 観測値の総数
- MIN : 最小値
- MAX : 最大値
- AVERAGE : 平均
- STD : 標準偏差
次の例は、 Fishという SAS 組み込みデータセットでこの手順を使用する方法を示しています。このデータセットには、フィンランドの湖で捕れた 159 匹の異なる魚のさまざまな測定値が含まれています。
proc printを使用して、このデータセットの最初の 10 個の観測値を表示できます。
/*view first 10 observations from Fish dataset*/ proc print data =sashelp.Fish( obs = 10 ); run ;
関連: SAS で外れ値を特定する方法
例 1: 変数を使用したプロシージャの概要
次のコードを使用して、Weight 変数の記述統計を計算できます。
/*calculate descriptive statistics for Weight variable*/
proc summary data =sashelp.Fish;
var Weight ;
output out =summaryWeight;
run ;
/*print output dataset*/
proc print data =summaryWeight;
出力テーブルを解釈する方法は次のとおりです。
- _TYPE_: この列は、データセット内の各行が記述統計の計算に使用されたかどうかを示します。 0 = すべての行が使用されました。
- _FREQ_: 各記述統計の計算に使用される行数。
- _STAT_: 記述統計の名前。
- 重み: 対応する記述統計量の数値。
結果から次のことがわかります。
- 観察の総数は158でした。
- 最小重み値は0でした。
- 最大重量値は1,650でした。
- 平均重量値は398.70でした。
- 重量値の標準偏差は359.09でした。
これら 5 つの値から、Weight 変数の値の分布をかなりよく理解できます。
例 2: 複数の変数を使用したプロセスの概要
複数の変数の記述統計を一度に計算するには、 varステートメントに複数の変数名をリストするだけです。
たとえば、次のコードを使用して、変数「体重」と「身長」の記述統計を計算できます。
/*calculate descriptive statistics for Weight and Height variables*/
proc summary data =sashelp.Fish;
var Weight Height ;
output out =summaryWeightHeight;
run ;
/*print output dataset*/
proc print data =summaryWeightHeight;
この結果から、体重と身長に関する 5 つの記述統計がわかります。
例 3: 1 つの変数を別の変数でグループ化したプロセスの概要
別の変数によってグループ化された変数の記述統計を計算するには、 classステートメントを使用できます。
たとえば、次のコードを使用して、種ごとにグループ化された体重の記述統計を計算できます。
/*calculate descriptive statistics for Weight grouped by Species*/
proc summary data =sashelp.Fish;
var Weight ;
class Species;
output out =summaryWeightSpecies;
run ;
/*print output dataset*/
proc print data =summaryWeightSpecies;
出力テーブルには、各魚種の記述統計が表示されます。
たとえば、鯛の魚だけについては、次のような記述統計を観察できます。
- 観察の総数は34でした。
- 最小重み値は242でした。
- 最大重量値は1000でした。
- 平均重量値は626でした。
- 重量値の標準偏差は206.60でした。
他のすべての種についても、これらの記述統計を観察できます。
追加リソース
次のチュートリアルでは、SAS で他の一般的なタスクを実行する方法について説明します。
SAS で Proc Append を使用する方法
SAS で Proc Tabulate を使用する方法
SAS で相関関係を計算する方法
SAS で度数表を作成する方法