HI,欢迎来到好期刊网,发表咨询:400-888-9411 订阅咨询:400-888-1571证券代码(211862)

基于CNN和LSTM混合模型的中文词性标注

摘要:中文词性标注具有重要的作用,它的准确性和标注速度直接影响到自然语言处理的后续任务.提出一种基于CNN(convolutional neural network)和LSTM(long-short term memory)混合模型进行中文词性标注.该模型采用三层结构,用词向量和CNN的滑动窗口特性产生词语表示特征,LSTM的时序性来产生词性标注的序列标签.分别在PFR《人民日报》语料库、CTB7.0和CoNLL09语料库上对该模型进行测试,在未加入任何人工特征的条件下,对词语进行词性标注,词性标注效果好于HMM(hidden Markov model)、MLP(multi-layer perceptron)、CNN和LSTM.

关键词:
  • 词性标注  
  • 卷积神经网络  
  • 长短期记忆  
  • 实验分析  
作者:
谢逸; 饶文碧; 段鹏飞; 陈振东
单位:
武汉理工大学计算机科学与技术学院; 湖北武汉430070
刊名:
武汉大学学报·理学版

注:因版权方要求,不能公开全文,如需全文,请咨询杂志社

武汉大学学报·理学版紧跟学术前沿,紧贴读者,国内刊号为:42-1674/N。坚持指导性与实用性相结合的原则,创办于1930年,杂志在全国同类期刊中发行数量名列前茅。