萨默斯 d 是什么? (定义&;示例)
Somers’ D是 Somers’ Delta 的缩写,是序数因变量和序数自变量之间关联强度和方向的度量。
序数变量是指值具有自然顺序的变量(例如“坏”、“中性”、“好”)。
Somers’ D 的值介于 -1 和 1 之间,其中:
- -1:表示所有变量对不一致
- 1:表示所有变量对都匹配
Somers’ D 在实践中用于许多非参数统计方法。
Somers’ D:定义
给定两个变量 X 和 Y,我们可以说:
- 如果两个元素的等级匹配,则两对 (x i , y i ) 和 (x j , y j ) 是一致的。
- 两对 (x i , y i ) 和 (x j , y j )不一致 如果两个元素的等级匹配。
然后我们可以使用以下公式计算 Somers’ D:
萨默斯的 D = ( NC – N D ) / ( NC + N D + NT )
金子:
- N C :匹配对的数量
- ND :不一致对的数量
- N T :并列对的数量
结果值始终在 -1 和 1 之间。
Somers’ D:R 中的示例
假设一家杂货店想要评估以下两个序数变量之间的关系:
- 收银员整体友善程度(排名1至3)
- 总体客户体验满意度(也排名 1 至 3)
他们从 10 名客户的样本中收集了以下评级:
为了量化两个变量之间的关系,我们可以使用 R 中的以下代码来计算 Somers’ D:
#enter data nice <- c(1, 1, 1, 2, 2, 2, 3, 3, 3, 3) satisfaction <- c(2, 2, 1, 2, 3, 2, 2, 3, 3, 3) #load DescTools package library(DescTools) #calculate Somers' D SomersDelta(nice, satisfaction) [1] 0.6896552
Somers 的 D 结果是0.6896552 。
该值非常接近 1,这表明两个变量之间存在相当强的正相关关系。
这具有直观意义:对收银员评价更好的顾客也往往对他们的整体满意度评价更高。