二元变量 的 相似度 计算方法 : 使用 区间标度变量 求样本间距离的方式 处理二元变量 , 误差很大 , 因此这里引入 二元变量可能性表 , 来计算样本的二元变量属性的相似度 ;
II ....样本有
p
个属性 , 每一对 对比相似度的样本都有 一个样本
i
和 一个样本
j
; 第
1
行第
1
列 表示 在一对相似度对比的样本中 , 样本
i
和 样本
j...简单匹配系数 ( 恒定相似度计算 )
----
简单匹配系数 : 两个样本
i , j
之间 , 对称二元变量 的 恒定相似度 计算 , 使用 简单匹配系数 公式计算 , 公式如下 :
d(i ,...Jaccard 系数 ( 非恒定相似度计算 )
----
Jaccard 系数 : 两个样本
i , j
之间 , 不对称二元变量 的 非恒定相似度 计算 , 使用 Jaccard系数 公式计算 ,...: 样本之间要进行 两两 对比 , 即进行
3
选
2
的组合 ( 不是排列 ) , 有
C_3^2 = 3
种方式 , 分别是 Tom 与 Mary 相似度对比 , Tom 与 Jerry