文本情感倾向性分析方法:bfsmPMI-SVM

摘要:为了提高文本情感倾向性分类的精度,提出了一种文本情感倾向性分析方法 bfsmPMI-SVM.该方法在文本预处理阶段,滤除了对表述主题情感倾向性不强烈的语句以及无关停用词等;用改进的PMI-IR算法对情感倾向性词语抽取,并自动扩充了正负基准词集;改进了互信息(MI)算法,在MI的计算中增加了词频因子(f)、类别差异因子(b)和符号因子(s).利用改进的MI算法选择文本特征,融合其他一些文本特征,用SVM实现文本情感倾向性分类.实验以食品安全领域爬取文本为例,与PMI-IR-SVM和MI-SVM算法的倾向分析相比,本文方法的正向文本准确率、负向文本准确率、召回率和F1值等都有提高.

关键词:
  • 文本情感倾向性分类  
  • 互信息  
  • 点互信息信息抽取  
  • 支持向量机  
作者:
刘金硕; 李哲; 叶馨; 陈嘉敏; 邓娟
单位:
武汉大学计算机学院; 湖北武汉430072; 武汉大学国际软件学院; 湖北武汉430079
刊名:
武汉大学学报·理学版

注:因版权方要求,不能公开全文,如需全文,请咨询杂志社

武汉大学学报·理学版紧跟学术前沿,紧贴读者,国内刊号为:42-1674/N。坚持指导性与实用性相结合的原则,创办于1930年,杂志在全国同类期刊中发行数量名列前茅。