衡量数据对象之间相关的程度 d(i,j)表示第i个数据与第j个数据之间的距离
我们可以用失配比的方法进行计算。 两个数的失配比指它们中值 不相等 的属性个数占总属性个数的比例 如 计算距离时没有必要考虑都不存在的属性,可以使用一个称为jaccard相似系数的计算方法 如
欧拉距离:两点间的直线距离 曼哈顿距离 切比雪夫距离 闵可夫斯基距离 当p=1时,就是曼哈顿距离 当p=2时,就是欧氏距离 当p→∞时,就是切比雪夫距离