HI,欢迎来到好期刊网,发表咨询:400-888-9411 订阅咨询:400-888-1571证券代码(211862)

重复数据中关键属性值缺失填补的改进ROUSTIDA算法

摘要:随着数据分析研究的兴起,数据预处理越来越得到研究者的重视,其中缺失数据填补问题的重要性也逐渐显现。在ROUSTIDA数据补齐算法的基础上,针对具有关键属性的重复数据的特点,文中提出了一种改进的ROUSTIDA算法——Key&Rpt_RS算法。Key&Rpt_RS算法继承了ROUSTIDA算法的优势,同时考虑了目标数据的重复性特点,分析了关键属性对填补效果的影响,得到了更加准确且有效的填补结果。

关键词:
  • 数据预处理  
  • 重复数据  
  • 缺失填补  
  • roustida算法  
作者:
樊哲宁; 杨秋辉; 翟宇鹏; 万莹; 王帅
单位:
四川大学计算机学院(软件学院); 成都610065
刊名:
计算机科学

注:因版权方要求,不能公开全文,如需全文,请咨询杂志社

期刊名称:计算机科学

计算机科学杂志紧跟学术前沿,紧贴读者,国内刊号为:50-1075/TP。坚持指导性与实用性相结合的原则,创办于1974年,杂志在全国同类期刊中发行数量名列前茅。