摘要:聚类分析在无监督学习领域中一直备受国内外学者关注.针对K-means聚类算法对初始聚类中心点敏感、簇内数据相关性差以及收敛到局部最优的缺点,提出了一种基于离群因子的优化聚类算法.该算法采用信息熵加权欧式距离作为相似性度量依据,以更明显地区分数据对象间的差异,然后利用k距离参数自调整的局部异常因子检测算法计算出各数据点的离群因子并筛选出初始聚类中心的候选集,最后根据其离群因子加权距离法优化聚类中心.通过在UCI数据集上的实验测试结果表明,优化算法的准确率比K-means++算法、OFMMK-means算法、FCM算法更高,运行速度比FCM算法更快.该算法能够更好地应用于入侵行为检测、信用风险评估以及多故障诊断等领域.
注:因版权方要求,不能公开全文,如需全文,请咨询杂志社