如何在 sas 中创建相关矩阵(附示例)
它提供了一种快速方法来了解数据集中变量之间存在的线性关系的强度。
您可以使用 SAS 中的PROC CORR语句为给定数据集创建相关矩阵:
/*create correlation matrix using all numeric variables in my_data*/
proc corr data =my_data;
run ;
默认情况下,这将创建一个矩阵,显示数据集中所有数值变量之间的相关系数。
要仅在相关矩阵中包含特定变量,可以使用VAR语句:
/*create correlation matrix using only var1, var2 and var3 in my_data*/
proc corr data =my_data;
var var1, var2, var3;
run ;
以下示例显示如何在 SAS 中创建相关矩阵。
示例:在 SAS 中创建相关矩阵
假设我们在 SAS 中有以下数据集,其中包含有关各种篮球运动员的信息:
/*create dataset*/
data my_data;
input team $ assists rebounds points;
datalines ;
A 4 12 22
A 5 14 24
A 5 13 26
A 6 7 26
B 7 8 29
B 8 8 32
B 8 9 20
B 10 13 14
;
run ;
/*view dataset*/
proc print data =my_data;
我们可以使用PROC CORR语句创建一个相关矩阵,默认情况下包含数据集中的每个数值变量:
/*create correlation matrix using all numeric variables in my_data*/
proc corr data =my_data;
run ;
输出显示第一个表中数值变量的汇总统计数据以及相关矩阵。
请注意,“团队”变量未包含在相关矩阵中,因为它不是数值变量。
以下是解释相关矩阵值的方法:
(1)助攻数和篮板数之间的皮尔逊相关系数(r)为-0.24486 。相应的 p 值为0.5589 。
由于 r 小于零,这告诉我们这两个变量之间存在负线性关联。然而,p 值不小于 0.05,因此这种相关性在统计上不显着。
(2)助攻与得分之间的皮尔逊相关系数(r)为-0.32957 。相应的 p 值为0.4253 。
这两个变量之间存在负线性关联,但在统计上并不显着。
(3)篮板数与得分之间的皮尔逊相关系数(r)为-0.52209 。相应的 p 值为0.1844 。
这两个变量之间存在负线性关联,但在统计上并不显着。
请注意,我们还可以使用VAR语句在相关矩阵中仅包含特定的数值变量:
/*create correlation matrix using only assists and rebounds variables*/
proc corr data =my_data;
var assists rebounds;
run ;
请注意,此相关矩阵中仅包含助攻和篮板变量。
其他资源
以下教程解释了如何在 SAS 中执行其他常见任务: