HI,欢迎来到好期刊网,发表咨询:400-888-9411 订阅咨询:400-888-1571证券代码(211862)

基于注意力机制的LSTM语音情感主要特征选择

摘要:传统的语音情感识别方式采用的语音特征具有数据量大且无关特征多的特点,因此选择出与情感相关的语音特征具有重要意义。通过提出将注意力机制结合长短时记忆网络(LongShortTermMemory,LSTM),根据注意力权重进行特征选择,在两个数据集上进行了实验。结果发现:(1)基于注意力机制的LSTM相比于单独的LSTM模型,识别率提高了5.4%,可见此算法有效提高了模型的识别效果;(2)注意力机制是一种有效的特征选择方法。采用注意力机制选择出了具有实际物理意义的声学特征子集,此特征集相比于原有公用特征集在降低了维数的情况下,提高了识别准确率;(3)根据选择结果对声学特征进行分析,发现有声片段长度特征、无声片段长度特征、梅尔倒谱系数(Mel-FrequencyCepstralCoefficient,MFCC)、F0基频等特征与情感识别具有较大相关性。

关键词:
  • 特征选择  
  • 语音情感识别  
  • 深度学习  
  • 注意力机制  
作者:
胡婷婷; 冯亚琴; 沈凌洁; 王蔚
单位:
南京师范大学教育科学学院机器学习与认知实验室; 江苏南京210097
刊名:
声学技术

注:因版权方要求,不能公开全文,如需全文,请咨询杂志社

期刊名称:声学技术

声学技术杂志紧跟学术前沿,紧贴读者,国内刊号为:31-1449/TB。坚持指导性与实用性相结合的原则,创办于1982年,杂志在全国同类期刊中发行数量名列前茅。