Sas で記述統計を計算する方法
記述統計は、一連のデータを説明する値です。
これらは、データセットの中心がどこにあるのか、またデータセット内の値の分布を理解するのに役立ちます。
SAS で変数の記述統計を計算するには、次の 2 つの一般的な方法があります。
1. PROC MEANS を使用して要約統計量を計算します。
2. PROC UNIVARIATEを使用して詳細な記述統計を計算します。
次の例は、SAS の次のデータセットで各メソッドを実際に使用する方法を示しています。
/*create dataset*/ data my_data; input team $points assists; datalines ; At 10 2 At 17 5 At 17 6 At 18 3 At 15 0 B 10 2 B 14 5 B 13 4 B 29 0 B 25 2 C 12 1 C 30 1 C 34 3 C 12 4 C 11 7 ; run ; /*view dataset*/ proc print data =my_data;
例 1. PROC MEANS を使用して要約統計量を計算する
次のコードは、 PROC MEANS を使用してデータセット内のポイント変数の要約統計量を計算する方法を示しています。
/*calculate summary statistics for points variable*/ proc means data =my_data; var points; run ;
PROC MEANSプロシージャは、次の記述統計を計算します。
- N : 観測値の総数
- 平均: ポイントの平均値
- Std Dev: ポイントの標準偏差
- 最小値: ポイントの最小値
- 最大値: ポイントの最大値
また、class ステートメントを使用して、ある変数の記述統計を別の変数でグループ化して計算できることにも注意してください。
たとえば、次のコードを使用して、チーム変数ごとにグループ化されたポイント変数の概要統計を計算できます。
/*calculate summary statistics for points, grouped by team*/ proc means data =my_data; classteam ; var points; run ;
出力には、ポイント変数の概要統計が、一意のチーム値ごとにグループ化されて表示されます。
例 2. PROC UNIVARIATE を使用して詳細な記述統計を計算する
次のコードは、 PROC UNIVARIATEを使用してポイント変数の詳細な記述統計を計算する方法を示しています。
/*calculate detailed descriptive statistics for points variable*/ proc univariate data =my_data; var points; run ;
PROC UNIVARIATEプロシージャは、平均、中央値、最頻値、標準偏差、分散、範囲、四分位範囲などを含む点変数の詳細な記述統計を計算します。
また、クラスステートメントを使用して、チーム変数ごとにグループ化されたポイント変数の詳細な記述統計を計算することもできます。
/*calculate detailed descriptive statistics for points, grouped by team*/ proc univariate data =my_data; classteam ; var points; run ;
これにより、チームの一意の値ごとにグループ化された、ポイント変数の詳細な記述統計を表示する 3 つのグループの出力テーブルが生成されます。
追加リソース
次のチュートリアルでは、SAS で他の一般的なタスクを実行する方法について説明します。