简单匹配系数

简单匹配系数英語:,缩写),又称为兰德相似系数(),是用于比较样本信合之间相似性与多样性统计量[1]

A
01
B0
1

假设两个对象A与B分别有n个二值属性,则SMC的定义为:

其中

表示AB的数值都为1的属性数量;
表示A的数值为0、而B的数值为1的属性数量;
表示A的数值为1、而B的数值为0的属性数量;
表示AB的数值都为0的属性数量。

类似地,可以定义简单匹配距离(,缩写)为,用于量度样本集合间的不相似度。[2]

SMC与汉明相似度间呈线性关系:。而其与欧基里得距离间的关系为,其中n为属性总数。SMC与雅卡尔指数也很相似,区别在于在雅卡尔指数的定义中分子与分母都没有项。

参考文献

This article is issued from Wikipedia. The text is licensed under Creative Commons - Attribution - Sharealike. Additional terms may apply for the media files.