Sas で z スコアを計算する方法


統計では、 Z スコアは、値が平均からどれだけ標準偏差があるかを示します。

次の式を使用して Z スコアを計算します。

z = (X – μ) / σ

金:

  • X は単一の生データ値です
  • μ はデータセットの平均です
  • σ はデータセットの標準偏差です

次の例は、SAS で生データ値の Z スコアを計算する方法を示しています。

例: SAS での Z スコアの計算

SAS で次のデータセットを作成するとします。

 /*create dataset*/
data original_data;
    input values;
    datalines ;
7
12
14
12
16
18
6
7
14
17
19
22
24
13
17
12
;
run ;

/*view dataset*/
proc print data = original_data;

ここで、データセット内の各値の Z スコアを計算するとします。

proc sql を使用してこれを行うことができます。

 /*create new variable that shows z-scores for each raw data value*/
proc sql ;
    select values, (values - mean(values)) / std(values) as z_scores
    from original_data;
quit ; 

SAS の z スコア

列には元のデータ値が表示され、 z_scores列には各値の Z スコアが表示されます。

SAS で Z スコアを解釈する方法

Z スコアは、値が平均からどれだけ標準偏差があるかを示します。

z スコアは、正、負、またはゼロのいずれかになります。

正の Z スコアは特定の値が平均より高いことを示し、負の Z スコアは特定の値が平均より低いことを示し、ゼロの Z スコアは特定の値が平均と等しいことを示します。

データセットの平均と標準偏差を計算すると、平均は14.375 、標準偏差は5.162であることがわかります。

したがって、データセットの最初の値は 7 で、その Z スコアは (7-14.375) / 5.162 = -1.428でした。これは、値「7」が平均より 1.428 標準偏差低いことを意味します。

データの次の値 12 の Z スコアは (12-14.375) / 5.162 = -0.46でした。これは、値「12」が平均よりも 0.46 標準偏差低いことを意味します。

値が平均から離れるほど、その値の Z スコアの絶対値は大きくなります。

たとえば、値 7 は値 12 よりも平均 (14.375) から離れています。これは、7 の Z スコアの絶対値がより大きい理由を説明しています。

追加リソース

次の記事では、SAS で他の一般的なタスクを実行する方法について説明します。

SAS で外れ値を特定する方法
SAS でパーセンタイルを計算する方法
SAS で平均値、中央値、最頻値を計算する方法

コメントを追加する

メールアドレスが公開されることはありません。 が付いている欄は必須項目です