2023年第42卷第4期文章目次

2023, 42(4):1-7.

摘要 (87) HTML (0) PDF 6.72 M (229) 评论 (0) 收藏

摘要:针对传统特征点检测算法需人为制定检测机制和基于深度学习的特征点检测网络泛化能力不强的问题，引入灰度不变量和残差结构，设计并实现具备像素级特征点检测能力的残差不变量神经网络(residual-invariant neural network,Resinv- Unet)。采用自标注的方式，在真实场景图像数据集的基础上构建用于训练神经网络的数据集。实验结果表明，Resinv-Unet 相较于现有的特征点检测算法和特征点检测网络，在真实场景图像上具有更强的泛化能力和鲁棒性，在平均精确度、精确度和召回率上均取得更好的性能指标，其中，平均精确度达到0.7155、精确度达到0.7762、召回率达到0.7137。

改进 YOLOv5s的交通多目标检测方法

单慧琳，吕宗奎，付相为，王煜，张培琰，孙佳琪

2023, 42(4):8-15.

摘要 (54) HTML (0) PDF 13.43 M (208) 评论 (0) 收藏

摘要:为了提高交通目标检测的精度和效率，提出一种改进YOLOv5s的交通场景多目标检测方法，在YOLOv5s 的主干网络中引入高效的层聚合网络结构来提高模型学习目标特征的能力，引入了通道注意力和空间注意力结合的卷积注意力模块 (BAM)机制，进一步提高网络模型的特征提取能力，通过采用a-IoU 作为边界框回归损失函数，提高了边界框回归精度。实验结果表明，改进的目标检测模型相较于YOLOv5s原模型在检测精度上提升了2.4%,模型参数量和模型大小分别降低了 20.9%和19.1%。实现了在不同时间段准确且高效的检测交通场景的多种目标，保证了实时检测的应用需求。

基于改进双滑模的永磁同步电机无传感器控制

曾东红，李明，李志远，赖正贵

2023, 42(4):16-22.

摘要 (36) HTML (0) PDF 6.02 M (172) 评论 (0) 收藏

摘要:针对永磁同步电机中速度环传统比例积分控制(proportional integral,PI)超调量过大与传统滑模观测器(sliding mode observer,SMO)存在的高频抖振等问题，提出一种基于新型微分积分滑模控制器及新型滑模观测器的无感控制方法。该方法用新型微分积分滑模控制器代替PI 控制器，采用连续函数代替开关函数以减轻抖振，用指数趋近律设计滑模观测器并估计反电动势，并根据反电动势设计自适应律以避免低通滤波器的使用，得到较为精确的转子位置。最后通过 MATLAB/ Simulink搭建模型，结果表明该方法具有削弱抖振、无超调、准确估计转子位置的特点，转速最大误差从18下降至2.5r/min, 转子位置误差从0.048下降至0.021 rad。

一种单目VIO 定位精度与跟踪稳定性优化方法

谢波，张国良，李歆，张自杰，汪坤

2023, 42(4):23-30.

摘要 (28) HTML (0) PDF 10.62 M (176) 评论 (0) 收藏

摘要:为了提高视觉惯性同时定位与建图(visual-inertial simultaneous localization and mapping,VISLAM)系统的系统性能，提出了一种单目视觉惯性里程计(visual-inertial odometry,VIO)定位精度与跟踪稳定性优化方法。在相机位姿优化阶段，通过多残差项对相机位姿进行优化，提高系统的定位精度。在特征跟踪丢失时，通过惯性测量单元(inertial measurement unit, IMU)积分信息与特征点深度增强方法对系统进行重定位，提高系统的跟踪稳定性。针对所提方法，基于 ORB-SLAM3代码框架进行改进，并在开源数据集与真实环境中验证方法的可行性。实验结果表明，所提方法能够有效提高视觉惯性里程计的定位精度与跟踪稳定性。

基于噪声与干扰抑制的5G 波束检测算法与实现

江丹，刘祖深，安宇宁

2023, 42(4):31-37.

摘要 (33) HTML (0) PDF 6.54 M (220) 评论 (0) 收藏

摘要:针对5G外场测试中，同频多小区检测受噪声和干扰影响的问题，提出一种改进的阈值选取方法。算法通过分块计算信噪比以及峰均比来确定检测门限，并且基于DFT 的信道估计算法可以进一步降低噪声对信号检测的影响。检测出首强小区后，将其设为干扰信号，利用信号重构和干扰抑制算法，可以进一步提高有效5G小区的检测概率。在硬件实现上，充分利用 DSP 的多核并行信号处理能力，进一步提升分块检测的效率。仿真实验对比了不同场景下所提算法与传统算法的检测结果，平台实测验证了所提算法的有效性和可靠性。

含混合储能直流微电网混合势函数建模及稳定性分析

张国澎，郑钰麒，郑征，陈纪凯，黄涛

2023, 42(4):38-48.

摘要 (314) HTML (0) PDF 7.68 M (340) 评论 (0) 收藏

摘要:针对含恒功率负荷的混合储能直流微电网大扰动稳定及储能变换器建模问题，在推导混合储能(hybrid energy stor- age system,HESS)脉宽调制开关网络等效模型基础上，提出了一种基于混合势函数理论的含 HESS 直流微电网稳定性判据及分析方法。首先，计及 HESS 充放电特性，将含HESS 直流微电网系统的工作状态划分为buck 和 boost工作模式；接着，分别建立上述两种工作模式下基于脉宽调制开关网络等效模型的直流微电网系统混合势函数模型；最后，应用混合势函数理论第3稳定性定理，分别推导得到buck和 boost工作模式下的直流微电网大扰动稳定性判据，并对比基于开关平均模型的系统稳定性判据，提出的稳定性判据推导方法对系统动态行为预测更为准确。仿真验证了所提稳定性分析方法的合理性以及混合势函数判据的先进性。

基于引导滤波图像分层的红外烟尘图像增强

张博龙，刘星，水晨

2023, 42(4):49-55.

摘要 (23) HTML (0) PDF 10.12 M (144) 评论 (0) 收藏

摘要:为解决烟尘环境对红外图像增强处理的干扰，突出目标的轮廓细节，提出一种基于引导滤波图像分层的红外烟尘图像增强方法。首先利用引导滤波将图像拆分为基础层与细节层，对细节层使用分数阶微分掩模作增强处理；然后基于红外烟尘图像的特点设计了二次分层方法，利用各项异性扩散将基础层分为原始层与轮廓层；之后对原始层进行自适应直方图均衡化，对轮廓层进行增益放大并与细节层合并；最后利用平均亮度设置权值函数，将两层图像进行加权融合得到增强图像。实验结果表明，相较于其他增强算法，该方法能够更有效的提高烟尘干扰下红外图像的清晰度，突出其细节纹理特征，增强后3 组图像的平均梯度和信息熵平均值为7.7211及5.8114,相较于原始图像提升1.0119及3.1778。

视觉感知和步态控制——国际自主智能机器人大赛 U型赛算法综述

李琼，张莹，张春，张柏雯，金天晔，曾气亮，曾凡芳

2023, 42(4):56-65.

摘要 (27) HTML (0) PDF 5.10 M (161) 评论 (0) 收藏

摘要:近年来，随着人工智能技术的发展，可独立完成任务的自主智能机器人成为研究热点。视觉感知和步态控制作为机器人完成各项任务的重要手段，是亟需不断深入研究的技术点。为了拓展小型人形机器人的自主智能水平和应用场景，本文从国际自主智能机器人大赛技术问题出发，研究分析视觉感知和步态控制在模拟人类生活场景的任务(即U 型赛)中的应用。首先，对比赛环境和软硬件平台进行介绍，其次分别分析了视觉感知和步态控制在大赛中的应用方法和算法实现，并以上下开横杆为例，介绍了U 型赛参赛队伍所使用的算法并进行分析比较。随后，展示了历年参赛队伍的优秀成果，分析了比赛任务完成度，指出比赛的研究难点及可能的解决方向。最后，对未来大赛的技术应用发展方向进行总结。

基于可解释深度学习的电力负荷预测模型

李妙彤，王永，肖玲，江河

2023, 42(4):66-73.

摘要 (33) HTML (0) PDF 6.11 M (191) 评论 (0) 收藏

摘要:深度学习模型在时间序列预测中得到了广泛的应用，然而，传统的深度学习点预测模型更多关注未来某个特定时刻的预测值，无法描述复杂时间序列预测的不确定性。此外，大多数深度学习模型的预测过程是不透明的，使用者对深度学习预测模型的内部机理缺乏认识，导致模型预测的可解释性偏低。针对上述问题，引入了分位数回归理论，刻画复杂时间序列预测的不确定性特征；构建可解释深度学习模型并应用于纽约州首府地区的短期电力负荷预测。结果表明，预测模型在两个数据集上都具有较好的区间预测结果，置信水平为95%时，该模型在1月和7月的PICP 值分别为94.28%、93.23%,区间覆盖率趋于置信水平。相比于对比模型，模型的预测精度高、泛化能力强，能够提升短期电力负荷预测中的稳定性，可为电网管理者的相关决策提供数据支撑。

用于超声成像的阵列式光纤传感系统研究

马向东，徐立军，马建国

2023, 42(4):74-79.

摘要 (29) HTML (0) PDF 5.43 M (134) 评论 (0) 收藏

摘要:光学超声成像是一种新型的医学成像技术，相比于传统超声成像技术具有更高的分辨率和更高的对比度。目前，光学超声成像通常以单传感器采集超声信号，使用机械扫描视场进行超声成像，但这会导致相对较长的扫描时间和较低的帧速度。为了解决这一问题，提出了基于法布里一珀罗(Fabry-Perot,F-P) 干涉和激光多普勒测振两种原理的阵列式光纤超声传感系统，使用多个光纤传感单元并行采集处理信号来实现快速光学超声成像。搭建传感系统并进行超声传感实验，结果显示 F-P 干涉系统的灵敏度更高，实现了10 fps 的成像速度，而激光多普勒测振系统更适合全部通道并行传感，成像速度为 100 fps。研究实现了快速光学超声成像，这开创了光纤传感系统用于并行超声传感的先河，这在无损检测和生物医学超声成像方面具有巨大潜力。

可调谐探针起振系统设计

温阳，陈纵横，冯婕，舒鹏丽，马宗敏

2023, 42(4):80-85.

摘要 (30) HTML (0) PDF 2.54 M (124) 评论 (0) 收藏

摘要:为了兼顾非接触式原子力显微镜(noncontact atomic force microscope,NC-AFM)更高谐振频率探针的使用需求，并通过提高控制器精度进而提高NC-AFM分辨率，提出了一种基于探针一样品间原子作用力变化的全数字可调谐NC-AFM高分辨率探针起振系统。在Simulink 环境下对探针起振系统的控制部分进行了设计，通过现场可编程门阵列(FPGA) 实现了鉴相，滤波，锁频等功能；采用压电陶瓷片驱动探针振动，设计了操作便捷的探针座。将不同频率正弦信号提供给设计的起振系统进行功能性验证，实验结果表明，系统可以在20 kHz～50 MHz频率范围内跟踪探针谐振频率；最后使用起振系统成功使商用探针在谐振频率处振动，准确测出了探针的谐振频率及振动幅值，系统频率分辨率达到了0.1 Hz。

基于YOLOv5的草莓轻量化网络检测模型

杨世忠，王瑞彬，高升，邵明伟

2023, 42(4):86-95.

摘要 (35) HTML (0) PDF 11.16 M (127) 评论 (0) 收藏

摘要:随着现代农业技术的发展，草莓生产和采摘的自动化是一个必然的趋势，而草莓目标检测是实现采摘自动化的关键环节。基于YOLOv5目标检测算法，采用ShuffleNet轻量级网络结构替代原模型的特征提取网络，并在骨干网络提取的特征图后加入SE 通道方向的注意力机制，结合EIoU 和Alpha-IoU损失函数，设计了一个a-EIoU 损失函数，给定参数α的值为3, 统一指数化 IoU损失函数，据此获得更准确的边界框回归和目标检测。改进的模型在草莓小目标数据集上平均检测精度均值达到了97.6%,其中成熟草莓的准确率为99.4%,与YOLOv3、YOLOv4和YOLOv5相比，平均精度均值(mAP) 分别提高了5.4%、2.9%和1.1%,该模型识别图像传输帧率为125 fps, 比原YOLOv5模型提升了38 fps, 该实验模型更适应于移动端部署，为草莓采摘识别的自动化提供了一些理论基础。

基于SCARA机器人的包装工作站仿真设计

庞党锋，王虎

2023, 42(4):96-102.

摘要 (24) HTML (0) PDF 7.41 M (148) 评论 (0) 收藏

摘要:针对某食品工厂月饼包装生产线需要大量人力且工作效率较低问题，构建了基于SCARA 机器人的自动化包装工作站，依据包装流程进行离线编程，仿真分析了机器人工作站工作节拍、工作空间和轨迹规划。利用SolidWorks 和RobotStudio 搭建了工作站模型，结合实际场景进行规划布局，对机器人吸盘、传送带和包装盒进行了动态Smart 组件设计，完成I/O 信号的创建及连接，进行了编程和仿真分析。仿真结果表明，机器人运动轨迹平滑，速度和加速度连续，SCARA 机器人在食品包装生产线的应用后，提高了产线效率，降低了体力劳动强度，为自动化产线的智能升级、改造提供了借鉴。

新型电容电感测试仪校准装置的设计与实现

张心雨，梁晓瑜

2023, 42(4):103-109.

摘要 (25) HTML (0) PDF 1.26 M (153) 评论 (0) 收藏

摘要:针对使用电容器和电抗器对电容电感测试仪进行校准时面临的校准程序复杂、维护成本高、误差过大的技术问题，设计了一种新型电容电感测试仪校准装置。该校准装置包括档位自动切换模块、输出比例控制模块、移相切换模块、电流放大调整模块及控制模块，通过将测试仪需要测量的电容值与电感值转化为电压电流的相位关系实现标准值的溯源。设计中依据电流输出范围将标准值划分为7个档位且各档位间自动切换，可以有效提高校准精度。实验测试结果表明，电流放大调整模块输出电流的稳定度可达到10-4量级，对其在2与20V 输入电压下电容量及电感量标准值的测量不确定度分别进行评估，校准电感量与电容量相对扩展不确定度均优于0.15%,证明其测量不确定度满足设计要求。

一种机动车火花熄灭器的自动检测系统设计

韩博文，孙四通

2023, 42(4):110-116.

摘要 (21) HTML (0) PDF 2.79 M (127) 评论 (0) 收藏

摘要:为解决火花熄灭器检测中人工称量活性炭效率低、无法在线称量等问题，基于国家标准GB13365-2005, 提出了一种机动车火花熄灭器的自动检测系统设计。系统设计了自动称重装置，可实现检测过程中活性炭重量的自动实时称重。对于称重过程中气流造成的误差，采用软件方式进行实时自动校准，首先利用卡尔曼滤波算法对训练数据进行去噪，然后利用三次样条插值对降噪后数据进行拟合，构造误差补偿模型。实际在线测试结果表明，系统补偿后的称重误差可控制在1g 以内，满足了实际使用场景的需求。

PWM 方式控制能量输出问题研究

李硕，孙四通

2023, 42(4):117-124.

摘要 (25) HTML (0) PDF 3.20 M (188) 评论 (0) 收藏

摘要:对于控制电能的输出电路，在工程中一般是通过调整脉冲宽度调制(pulse width modulation,PWM)的占空比来控制流向负载的能量。但在实际应用中，如果在控制输出电路时不考虑能源的交直流形式，可能会出现占空比变化晶闸管的输出不发生变化，从而导致被控负载失控的问题。为解决此问题，分别研究了PWM 控制直流负载和交流负载方式，分析了不同 PWM周期和占空比下负载获取交流电压的情况，提出了PWM 控制晶闸管电路有关参数的配置方法。最后，通过水循环温度控制系统进行测试，测试结果表明，该方法实现了温度精准稳定的控制，能够为该领域内从事相关工作的工程师提供参考。

基于改进 YOLOv5的密集场景行人检测方法研究

高强，唐福兴，李栋，吉月辉，刘俊杰，史涛，苏艳杰

2023, 42(4):125-130.

摘要 (25) HTML (0) PDF 5.83 M (192) 评论 (0) 收藏

摘要:当前的研究中密集场景行人检测精度较低，为提高检测精度，提出一种基于YOLOv5 网络的改进方法 V-YOLO, 采用加权双向特征金字塔网络(bi-directional feature pyramid network,BiFPN)改进原始网络中的路径聚合网络(path aggrega- tion network,PANet),加强多尺度特征的融合能力，提高对行人目标的检测能力。为了保留更多的特征信息，提高主干网络的特征提取能力，添加残差结构VBlock;引入SKNet(select kernel networks)注意力机制，动态融合不同感受野的特征图，提高对不同行人特征的利用率。使用CrowdHuman 数据集进行训练和测试，实验结果表明，所提出算法比原始网络的精确度、召回率和平均精度值分别提高1.8%、2.3%和2.6%,验证了所提出算法能有效的提高密集场景下行人目标检测的准确率。

单聚合 YOLO航拍小目标检测算法

杨辉羽，李海明

2023, 42(4):131-140.

摘要 (28) HTML (0) PDF 7.44 M (166) 评论 (0) 收藏

摘要:使用无人机采集的航拍图中存在背景复杂、目标密集、目标重叠等诸多问题，这都对现有的目标检测网络提出了挑战。以YOLOv5 为基础进行改进，修改原有的BackBone网络，嵌入改进后的单聚合(OSA) 模块，解决因为网络深度造成的梯度衰减问题；针对原网络结构对小目标的定位不准确，获得的信息不充分问题，增加一个160×160的小目标检测层应对小目标难以检测问题，同时修改特征融合网络丰富语义信息；最后改进原有的损失函数CIoU, 长宽不再是一个统一的整体计算损失，而是分开优化，提高预测方框的准确度。算法在VisDrone2019无人机航拍数据集上实验结果表明，平均精度均值(mAP) 与原算法相比提升了5.2%,检测帧率达到了45 fps, 训练模型大小为18.9 MB。

基于改进的K-means风电机异常数据检测

陶永辉，王勇

2023, 42(4):141-148.

摘要 (26) HTML (0) PDF 6.01 M (179) 评论 (0) 收藏

摘要:风电机异常数据检测对维护风电设备的稳定运行有着重要意义，为解决K-means算法随机指定初始点聚类和风电机数据异常问题，提出一种改进K-means算法的风电机数据异常检测方法。改进之后的方法，首先选择数据样本中位数作为第一个初始聚类中心，在选取下一个聚类中心时，距离当前n 个聚类中心越远的点会有更高的概率被选为第n+1 个聚类中心，进而达到聚类中心互相距离较远的目的，以此对风电机运行数据进行聚类，检测出离群点及异常点，保障风电设备稳定运行。

基于双预训练 Transformer 和交叉注意力的多模态谣言检测

蒋保洋，但志平，董方敏，张洪志，刘致远

2023, 42(4):149-157.

摘要 (27) HTML (0) PDF 4.10 M (131) 评论 (0) 收藏

摘要:社交平台上文本和图像相结合的多模态谣言比纯文本谣言更易于误导用户，因此研究多模态的谣言检测方法具有重要意义。现有方法大多只是对各个模态特征直接进行向量拼接，忽略了模态间联系，不能充分利用多模态信息。为了解决上述问题，提出了一种基于双预训练Transformer 和交叉注意力机制的多模态谣言检测模型：首先使用预训练的Transformer (BERT 和ViT) 分别提取文本单词和图像的特征，克服了训练样本小的局限性；然后使用交叉注意力机制将文本和视觉特征进行特征融合，充分地学习到两种模态间的潜在联系；最后将得到的多模态融合特征输入谣言检测模块进行分类。实验结果表明，该模型在 Twitter 和微博数据集上的检测性能均高于多模态基准模型，有效性和泛化性进一步提升。

基于改进SSD 的青瓜检测算法

曾乾，李博

2023, 42(4):158-165.

摘要 (24) HTML (0) PDF 9.53 M (139) 评论 (0) 收藏

摘要:针对复杂近色背景下青瓜目标识别率低、定位效果不佳等问题，提出一种基于SSD 的循环融合特征增强(CFFE-SSD) 目标检测模型。首先，对 SSD 的前4个有效特征层进行循环特征融合，使低层特征层和高层特征层的信息得到有效利用；其次，针对青瓜目标的特殊长宽比以及重叠现象，使用K-means算法改进先验框的默认尺寸以及长宽比，提出以DIoU-NMS替换普通NMS; 最后，将ECA 注意力机制引入循环特征融合模块，增强网络特征提取能力。实验结果表明，改进CFFE-SSD 模型 AP@0.5 达到了96.63%,提升了4.61%;AP@0.75 达到了89.02%,提升了7.14%,检测速度达到144 fps, 边框回归精度更高，能有效满足青瓜自动采摘的需求。

基于FEEMD算法对小样本电磁信号的识别与分类

郭钰荣，姚金杰，白建胜，温雪芳

2023, 42(4):166-172.

摘要 (27) HTML (0) PDF 9.72 M (156) 评论 (0) 收藏

摘要:针对当前小样本条件下电磁信号识别算法在不同信噪比下识别准确率较低的问题，提出了一种模糊熵限阈经验模态分解(fuzzy entropy empirical mode decomposition,FEEMD)算法进行电磁信号特征提取，提取表征明显的数据展开短时傅里叶变换(short time Fourier transform,STFT),然后选用Transformer模型分类识别各制式信号。该算法采用8种不同制式的电磁信号分别在-10、-5、0、5、10 dB这5种信噪比下的识别准确率，确定了该网络的最优超参数。仿真结果表明，在5种信噪比下，2FSK、AM、ASK、SSB这4种调制信号识别率均超过90%,QAM16、QPSK和OFDM的准确率由30%～40%提升到了70%以上，由此表明了该算法的有效性和可实施性。

基于改进RetinaNet 的白酒瓶盖缺陷检测方法

车璇，朱文忠，李韬，胡友鑫

2023, 42(4):173-180.

摘要 (21) HTML (0) PDF 10.83 M (131) 评论 (0) 收藏

摘要:针对瓶装白酒包装质检存在的检测准确度低，小目标重合度高导致误检漏检的情况，提出一种基于RetinaNet 的目标检测优化算法，主要使用白酒瓶盖瑕疵数据集进行检测。方法将网络 Backbone替换为Swin Transformer,其包含的窗口注意力机制运算有效提升瓶盖瑕疵检测精度同时降低复杂度节省了计算量。在Neck 阶段使用神经架构搜索特征金字塔网络 (FPN) 代替FPN, 利用自动架构搜索选出最佳特征融合层，为后续检测提供更高质量的模型，最后采用Soft-NMS 降低检测框置信度保留一定真实框，有效的防止瓶盖瑕疵过近或重叠造成漏检。实验证明，改进算法能够精准的识别出各类瓶盖瑕疵，检测精度在白酒瓶盖瑕疵数据集达到了93.53%,相较于原网络提升了8.02%。

基于改进YOLVOv5s的 X 射线图像粘接缺陷实时检测

赵子文，金永，陈友兴，吴其洲，王召巴

2023, 42(4):181-186.

摘要 (30) HTML (0) PDF 5.44 M (145) 评论 (0) 收藏

摘要:为了兼顾火箭弹非金属粘贴结构缺陷的检测速度和准确率，提出一种基于改进YOLOv5s的 X 射线图像火箭弹缺陷检测算法。该算法在YOLOv5s的基础上使用深度分离卷积重新设计特征提取网络中 Bottleneck 结构，以此改进C3 模块，通过减少模型参数数量，提高运行速度。然后分别在特征提取网络的Focus 结构后和Neck 层的卷积和上采样之前加入卷积模块的注意力机制模块(CBAM), 用来提高模型对有效特征提取，使模型更加关注小目标，力图保持运行速度的同时提高检测精度。实验结果表明，该算法在自制的火箭弹粘贴缺陷数据集上测试的平均精度均值(mAP) 达到86.40%,比原始模型提高 6.44%,帧率为32 fps; 相比SSD、YOLOX-Tiny 网络算法，该模型在检测速度和检测精度上有着出色的综合表现，能够针对火箭弹非金属粘接结构缺陷进行高效的检测。

基于Transformer与增强信息融合的双源情感识别

闫超，贾振堂

2023, 42(4):187-193.

摘要 (31) HTML (0) PDF 4.08 M (147) 评论 (0) 收藏

摘要:为解决当前多模态情感识别效果不佳的问题，提出了一种基于Transformer 与增强信息融合的双源情感识别模型，模型由音视频编码分支网络和双源增强特征融合模块组成。其中，视频编码分支利用MobileViTv2提取每帧视频的空间特征，并通过在Transformer 编码器结构中内嵌残差结构，强化各帧短期关联语义信息的提取能力。在音频特征提取部分构建了维度匹配器，避免了潜在异构鸿沟，提高了模型训练的鲁棒性。在音视频特征融合处引入低参数量跨模态注意力机制，从两个角度同时增强特征融合能力。通过对比和消融实验证明了方法在多模态情感识别任务中的有效性。

网站首页

杂志简介

在线阅读

投稿须知

欢迎订阅

联系我们

>理论与方法

>研究与开发

>应用天地