3687.
总被引:12,自引:0,他引:12
最近邻分类方法中对距离机制的研究大都集中在根据何种计算方法将不同属性取值的差异集中起来,而未考虑到同一属性间取值的语义差异所带来的影响;而且传统算法的分类准确率对于不同抽象层次描述的数据集带来的数据不完整性相当敏感.针对这两个问题,提出一种基于语义距离的最近邻分类方法SD
kNN(semantic distance based
k-nearest neighbor).该方法分析了同一属性内取值的语义差异,说明了如何基于领域本体计算语义距离,并将其应用到kNN算法中.经过在UCI数据集以及实际应用数据集中验证,SD
kNN的整体性能要优于传统方法,在数据不完整的情况下效果更为明显,实践证明,SD
kNN有较好的应用价值.… …
相似文献