基于幅值滤波与分层特征融合策略的语音情感识别
DOI:
CSTR:
作者:
作者单位:

作者简介:

通讯作者:

中图分类号:

TN912.3

基金项目:

上海市科技计划项目(23010501500)资助


Speech emotion recognition based on amplitude filtering and hierarchical feature fusion strategy
Author:
Affiliation:

Fund Project:

  • 摘要
  • |
  • 图/表
  • |
  • 访问统计
  • |
  • 参考文献
  • |
  • 相似文献
  • |
  • 引证文献
  • |
  • 资源附件
  • |
  • 文章评论
    摘要:

    针对语音情感识别在多语言联合数据集上识别准确率低的问题,提出了一种基于幅值滤波与分层特征融合策略的语 音情感识别方法。该方法首先对梅尔谱图内幅值分布规律进行幅值滤波,通过概率叠加扩大梅尔谱图内相近幅值之间的差 异,实现谱图内的高频强增益、低频弱增益;同时,通过概率相乘缩小梅尔谱图内相远幅值之间的差异,以显示谱图内中频的 细节部分。在此基础上,使用矩形卷积提取音频信号的时间动态特征,生成梅尔谱图动态特征图,并将其作为分层特征融合 策略的输入。分层特征融合策略通过压缩特征图来提取不同尺度的时间动态特征,并提取不同深度中的时间动态特征。在 多语言联合数据集 CER 上取得了84.44%的分类准确率。

    Abstract:

    A speech emotion recognition method based on amplitude filtering and hierarchical feature fusion strategy is proposed in response to the problem of low accuracy of speech emotion recognition on multi-language joint datasets.The method first applies amplitude filtering to the amplitude distribution pattern in the Mel spectrogram,enlarging the differences between similar amplitudes and achieving high frequency strong gain and low frequency weak gain within the spectrogram.Meanwhile,by multiplying probabilities,it reduces the differences between distant amplitudes in the Mel spectrogram,displaying the detailed middle frequency components. Based on this,the method uses rectangular convolution to extract the temporal dynamic features of the audio signal,generating dynamic feature maps of the Mel spectrogram,which serve as inputs to the hierarchical feature fusion strategy.The hierarchical feature fusion strategy compresses the feature maps to extract temporal dynamic features of different scales and from different depths.The proposed method achieves a classification accuracy of 84.44%on the multi-language joint dataset CER.

    参考文献
    相似文献
    引证文献
引用本文

喻永振,刘大明.基于幅值滤波与分层特征融合策略的语音情感识别[J].国外电子测量技术,2024,43(3):35-42

复制
分享
文章指标
  • 点击次数:
  • 下载次数:
  • HTML阅读次数:
  • 引用次数:
历史
  • 收稿日期:
  • 最后修改日期:
  • 录用日期:
  • 在线发布日期: 2024-06-12
  • 出版日期:
文章二维码