2024, 43(3):121-128.
摘要:针对分心驾驶检测方法存在实时性差、精度低、可部署性差的问题,提出了一种基于上下文语义增强联合 YOLOv7 的 分心驾驶检测算法。首先将模型 backbone 和 head 部分的 ELAN 模块替换成语义上下文增强模块(contextual transformer, CoT), 提高上下文语义信息的捕获能力。其次,将语义关联增强机制(triplet attention)融入卷积块中,插入 backbone 和 head 的连接头之间以及融合 MP2 模块,强化目标间的关联关系以及提升目标特征提取能力。最后,将自注意力双向 Transformer 模块(Biformer) 模块融合 SPPCSPC 模块,提升模型对分心驾驶中的复杂场景和遮挡目标的处理能力。改进的 YOLOv7 算法 在分心驾驶数据集下平均精度均值(mean average precision,mAP)达到了87.3%,比原算法提高了4.3%,模型参数量减少了4.7%,每秒传输帧数达到了90 fps,具有较好的检测精度与速度。