萨默斯 d 是什么? (定义&示例)


Somers’ D是 Somers’ Delta 的缩写,是序数因变量和序数自变量之间关联强度和方向的度量。

序数变量是指值具有自然顺序的变量(例如“坏”、“中性”、“好”)。

Somers’ D 的值介于 -1 和 1 之间,其中:

  • -1:表示所有变量对不一致
  • 1:表示所有变量对都匹配

Somers’ D 在实践中用于许多非参数统计方法。

Somers’ D:定义

给定两个变量 X 和 Y,我们可以说:

  • 如果两个元素的等级匹配,则两对 (x i , y i ) 和 (x j , y j ) 是一致的
  • 两对 (x i , y i ) 和 (x j , y j )不一致 如果两个元素的等级匹配。

然后我们可以使用以下公式计算 Somers’ D:

萨默斯的 D = ( NC – N D ) / ( NC + N D + NT )

金子:

  • N C :匹配对的数量
  • ND :不一致对的数量
  • N T :并列对的数量

结果值始终在 -1 和 1 之间。

Somers’ D:R 中的示例

假设一家杂货店想要评估以下两个序数变量之间的关系:

  • 收银员整体友善程度(排名1至3)
  • 总体客户体验满意度(也排名 1 至 3)

他们从 10 名客户的样本中收集了以下评级:

Somers 的示例 D

为了量化两个变量之间的关系,我们可以使用 R 中的以下代码来计算 Somers’ D:

 #enter data
nice <- c(1, 1, 1, 2, 2, 2, 3, 3, 3, 3)
satisfaction <- c(2, 2, 1, 2, 3, 2, 2, 3, 3, 3)

#load DescTools package
library(DescTools)

#calculate Somers' D
SomersDelta(nice, satisfaction)

[1] 0.6896552

Somers 的 D 结果是0.6896552

该值非常接近 1,这表明两个变量之间存在相当强的正相关关系。

这具有直观意义:对收银员评价更好的顾客也往往对他们的整体满意度评价更高。

其他资源

皮尔逊相关系数简介
肯德尔的 Tau 简介

添加评论

您的电子邮箱地址不会被公开。 必填项已用*标注