基于深度学习的文本特征提取研究综述

摘要:文本特征项的选择是文本挖掘和信息检索的基础和重要内容。传统的特征提取方法需要手工制作的特征,而手工设计有效的特征是一个漫长的过程,但针对新的应用深度学习能够快速地从训练数据中获取新的有效特征表示。作为一种新的特征提取方法,深度学习在文本挖掘方面取得了一定的成果。深度学习与传统方法的主要区别在于,深度学习能自动地从大数据中学习特征而不是采用手工制作的特征,手工制作的特征主要依赖于设计者的先验知识,很难充分利用大数据;深度学习可以自动地从大数据中学习特征表示,并包括数以万计的参数。文中概述了用于文本特征提取的常用方法,并阐述了在文本特征提取及应用中常用的深度学习方法,以及深度学习在特征提取中的应用展望。

关键词:
  • 深度学习  
  • 特征提取  
  • 文本特征  
  • 自然语言处理  
  • 文本挖掘  
作者:
张千; 王庆玮; 张悦; 纪校锋; 张宇翔; 祝赫; 赵昌志
单位:
中国石油大学(华东)计算机与通信工程学院; 山东青岛266580
刊名:
计算机技术与发展

注:因版权方要求,不能公开全文,如需全文,请咨询杂志社

期刊名称:计算机技术与发展

计算机技术与发展杂志紧跟学术前沿,紧贴读者,国内刊号为:61-1450/TP。坚持指导性与实用性相结合的原则,创办于1991年,杂志在全国同类期刊中发行数量名列前茅。