HI,欢迎来到好期刊网,发表咨询:400-888-9411 订阅咨询:400-888-1571证券代码(211862)

新的降维标准下的高维数据聚类算法

摘要:为了解决主成分分析(PCA)算法无法处理高维数据降维后再聚类精确度下降的问题,提出了一种新的属性空间概念,通过属性空间与信息熵的结合构建了基于特征相似度的降维标准,提出了新的降维算法ENPCA。针对降维后特征是原特征的线性组合而导致可解释性变差以及输入不够灵活的问题,提出了基于岭回归的稀疏主成分算法(ESPCA)。ESPCA算法的输入为主成分降维结果,不需要迭代获得稀疏结果,增加了灵活性和求解速度。最后在降维数据的基础上,针对遗传算法聚类收敛速度慢等问题,对遗传算法的初始化、选择、交叉、变异等操作进行改进,提出了新的聚类算法GKA++。实验分析表明EN-PCA算法表现稳定,GKA++算法在聚类有效性和效率方面表现良好。

关键词:
  • 聚类  
  • 特征相似度  
  • 岭回归  
  • 遗传算法  
作者:
万静; 吴凡; 何云斌; 李松
单位:
哈尔滨理工大学计算机科学与技术学院; 哈尔滨150080
刊名:
计算机科学与探索

注:因版权方要求,不能公开全文,如需全文,请咨询杂志社

期刊名称:计算机科学与探索

计算机科学与探索杂志紧跟学术前沿,紧贴读者,国内刊号为:11-5602/TP。坚持指导性与实用性相结合的原则,创办于2007年,杂志在全国同类期刊中发行数量名列前茅。