融合改进 YOLOv7 与 UNet 的编码点定位方法
DOI:
CSTR:
作者:
作者单位:

作者简介:

通讯作者:

中图分类号:

TP391.4

基金项目:

国家自然科学基金地区基金(12162031)、西安交通大学机械制造系统工程国家重点实验室(sklms2022022) 项目 资助


Fusion of improved YOLOv7 and UNet codepoint localization methods
Author:
Affiliation:

Fund Project:

  • 摘要
  • |
  • 图/表
  • |
  • 访问统计
  • |
  • 参考文献
  • |
  • 相似文献
  • |
  • 引证文献
  • |
  • 资源附件
  • |
  • 文章评论
    摘要:

    针对编码点的定位存在误检率高和精准度差的问题,提出了一种融合改进 YOLOv7 与 UNet 的圆形编码点定位方 法。第1阶段使用改进的 YOLOv7 检测编码点的位置,改进的 YOLOv7 首先将DCN-v2 可变形卷积引入 ELAN 模块,提升 特征提取能力;其次把卷积块注意力模块(CBAM) 机制嵌入骨干网络使网络更关注目标特征;然后使用Focal-EloU Loss 提高 收敛速度;最后构建 OD-Cat 模块替换 ConCat 模块以提升网络检测精度。提取出每个圆形编码点的 ROI 后,第2阶段通过 UNet 分割出编码点的中心轮廓后,使用最小二乘法拟合出编码点的中心。实验结果表明,改进后的模型比原 YOLOv7 的精 确率提高了6.33%,平均精度均值(mAP) 提升了5.76%;提出的定位方法验证了在噪声、亮度不足或曝光等复杂环境下可以 准确定位出编码点的中心椭圆轮廓,在实际工业视觉测量中具备鲁棒性。

    Abstract:

    Aiming at the problems of high misdetection rate and poor accuracy in the localization of codepoints,a circular codepoint localization method fusing improved YOLOv7 and UNet is proposed.In the first stage,the improved YOLOv7 is used to detect the location of coding points.The improved YOLOv7 firstly introduces DCN-v2 deformable convolution into the ELAN module to improve the feature extraction ability.Secondly,the CBAM attention mechanism is embedded into the backbone network to make the network pay more attention to the target features.Then,Focal-EloU loss is used to improve the convergence speed.Finally,OD-Cat is constructed to replace the ConCat module to improve the network detection accuracy.Module to replace the ConCat module to improve the network detection accuracy.After extracting the ROI of each circular coding point,the center contour of the coding point is segmented by UNet in the second stage, and then the center of the coding point is fitted using the least squares method.The experimental results show that the improved model improves the precision by 6.33%and the mean average precision(mAP)by 5.76%over the original YOLOv7.The proposed localisation method verifies that it can accurately locate the central ellipse contour of the coded point under complex environments such as noise,insufficient brightness or exposure,and is robust in practical industrial vision measurements.

    参考文献
    相似文献
    引证文献
引用本文

刘 升,古丽巴哈尔·托乎提,补生来,买买提明·艾尼.融合改进 YOLOv7 与 UNet 的编码点定位方法[J].国外电子测量技术,2024,43(5):9-17

复制
分享
文章指标
  • 点击次数:
  • 下载次数:
  • HTML阅读次数:
  • 引用次数:
历史
  • 收稿日期:
  • 最后修改日期:
  • 录用日期:
  • 在线发布日期: 2024-06-25
  • 出版日期:
文章二维码