位置: IT常识 - 正文

【YOLOv7】主要改进点详解(yolov4参数设置)

编辑:rootadmin
【YOLOv7】主要改进点详解 文章目录YOLOv7介绍整体网络架构高效聚合网络重参数化卷积辅助头检测动态标签分配总结YOLOv7介绍

推荐整理分享【YOLOv7】主要改进点详解(yolov4参数设置),希望有所帮助,仅作参考,欢迎阅读内容。

文章相关热门搜索词:yolo v5改进,yolov5改进bifpn,yolov2改进,yolov2改进,yolov5改进bifpn,yolov3怎么改进,yolov3怎么改进,yolov5怎么改进,内容如对您有帮助,希望把文章链接给更多的朋友!

YOLOv7论文在上个月6号挂在了Arxiv上之后,引起了巨大轰动,短短一个月的时间,Github上就有了4.3k个Star。

从论文题目可以看出来,YOLOv7又是一个集大成者的杰作;从Github源码可以看出, 整体结构与YOLOv5极其相似,因此有YOLOov5基础的小伙伴可以无脑上手v7。

另外来看下v7的两位大牛作者,一作是 Chien-Yao Wang,近几年一直耕耘在目标检测领域,尤其是YOLO系列,代表作:YOLOv7、YOLOR、ScaledYOLOv4、CSPNet等。二作是 Alexey Bochkovskiy,就是在20年Joseph Redmon宣布退出CV领域后扛起YOLO系列大旗并发布YOLOv4的那位大神。  

整体网络架构

YOLOv7完整网络架构以及各组件的详细解析可以移步至:【YOLOv7_0.1】网络结构与源码解析,这里从另一个角度来了解YOLOov7的网络架构:

上面这张图是根据我目前的理解,对YOLOv7的整体结构进行的拆分,可能会有不正确的地方,欢迎各位小伙伴前来交流~

可以很清楚的看到,YOLOv7大部分继承自YOLOv5,包括整体网络架构、配置文件的设置和训练、推理、验证过程等等,基本上熟悉v5就可以无脑上手v7了;此外,v7也有不少继承自YOLOR,毕竟是同一个作者前后年的工作,包括不同网络的设计、超参数设置以及隐性知识学习的加入;还有就是在正样本匹配时仿照了YOLOX的SimOTA策略。

除了这些在已有YOLO版本中的算法之外,YOLOv7还包括了近几年最新的trick:高效聚合网络(目前论文还未接收)、重参数化卷积、辅助头检测、模型缩放等等,因此学习YOLOv7还是非常有价值的。  

高效聚合网络

图a和图b是之前常用的特征提取网络,图c则是YOLOv7主要用到的ELAN网络,虽然有引文,但是并没有任何详细资料来学习,对此,作者是这么说的:

ELAN paper will be released after accept at the latest.

好叭,那就再等等。图d是对ELAN的改进,其等效网络就是下面这个,也就是两个ELAN(红框里)的Concat,作者的解释是:

For E-ELAN architecture, since our edge device do not support group convolution and shuffle operation, we are forced to implement it as an equivalence architecture.

【YOLOv7】主要改进点详解(yolov4参数设置)

重参数化卷积

重参数化的作用:在保证模型性能的条件下加速网络,主要是对卷积+BN层以及不同卷积进行融合,合并为一个卷积模块。

下面给出了卷积+BN融合的公式化过程,红色表示卷积参数(权重和偏置),蓝色是BN参数(mmm是输入均值,vvv是输入标准差,γ\gammaγ和β\betaβ是两个可学习的参数),最终经过一系列化简,融合成了一个卷积:

在YOLOv7中,除了网络最后使用RepConv重参数化卷积之外,作者也提到了其他三处使用重参数化技巧的地方:

we perform reparameterization on conv-bn, repconv, orepa, and yolor.

对应model/yolo.py中model类的fuse函数(这里):

辅助头检测

YOLOv7中,将head部分的浅层特征提取出来作为Aux head(辅助头),深层特征也就是网络的最终输出作为Lead head(引导头),如图b所示。

在计算损失时:

图c的策略是,lead head和aux head分别、单独计算损失,最终相加图d的策略是,lead head单独计算损失,aux head将lead head匹配得到的正样本作为自己的正样本,并计算损失,最终相加(占比不同)图e的策略是,lead head单独计算损失,aux head将lead head匹配得到的正样本(这里是粗匹配,也就是选择GT框中心点所在网格的上下左右4个邻域网络作为正样本筛选区域)作为自己的正样本,并计算损失,最终相加(占比不同)

以training/yolov7-w6.yaml为例,最后detect模块的前四层为lead head,后四层为aux head,在推理时,只取前四层作为detect层的输出:

动态标签分配

YOLOv7的标签分配策略(正样本筛选),集成了YOLOv5和YOLOX两者的精华:

YOLOv5 Step1:Autoanchor策略,获得数据集最佳匹配的9个anchor(可选) Step2:根据GT框与anchor的宽高比,过滤掉不合适的anchor Step3:选择GT框的中心网格以及最邻近的2个邻域网格作为正样本筛选区域(辅助头则选择周围4个邻域网格)

YOLOX Step4:计算GT框与正样本IOU并从大到小排序,选取前10个值进行求和(P6前20个),并取整作为当前GT框的K值 Step5:根据损失函数计算每个GT框和候选anchor的损失,保留损失最小的前K个 Step6:去掉同一个anchor被分配到多个GT框的情况总结

概括:

YOLOv7在5FPS到160FPS的范围内,无论是速度或是精度,都超过了目前已知的检测器在V100上进行测试, 精度为56.8%AP的模型可达到30FPS(batch=1)以上的检测速率目前唯一一款在如此高精度下仍能超过30FPS的检测器

不足:

代码冗余,版本更新问题精度虚高(参考:如何评价AlexeyAB版的YOLOv7?)验证时数据预处理的图像缩放异常(没有做padding操作)验证时的NMS异常(应该是multi_label = False)

参考资料 目标检测算法——YOLOV7——详解 如何评价AlexeyAB版的YOLOv7?

本文链接地址:https://www.jiuchutong.com/zhishi/298384.html 转载请保留说明!

上一篇:R数据分析:临床预测模型中校准曲线和DCA曲线的意义与做法(r在数据分析中表示什么意思)

下一篇:查询数据库空间(mysql和oracle)(如何查询数据库表空间)

  • 微信怎么申请湖北健康码(微信怎么申请湖北健康码视频)

    微信怎么申请湖北健康码(微信怎么申请湖北健康码视频)

  • iphone12怎么关机(iPhone12怎么关机重启)

    iphone12怎么关机(iPhone12怎么关机重启)

  • 拼多多拼小圈如何设置不让别人看(拼多多拼小圈如何关闭不让别人看)

    拼多多拼小圈如何设置不让别人看(拼多多拼小圈如何关闭不让别人看)

  • 微信号四年没登注销了吗(微信号四年没登录怎么办)

    微信号四年没登注销了吗(微信号四年没登录怎么办)

  • 下雨天打雷wifi有必要关吗(下雨天打雷时,我们会先看到闪电,再听到雷声)

    下雨天打雷wifi有必要关吗(下雨天打雷时,我们会先看到闪电,再听到雷声)

  • 联想t440上市时间

    联想t440上市时间

  • 京东退款优惠券能退回吗(京东退款优惠券还在不)

    京东退款优惠券能退回吗(京东退款优惠券还在不)

  • windows movie maker是什么软件

    windows movie maker是什么软件

  • 一个人可以实名几个淘宝号(一个人可以实名几个快手号)

    一个人可以实名几个淘宝号(一个人可以实名几个快手号)

  • 同一wifi检测不到dlna(在同一wifi下为什么搜索不到设备)

    同一wifi检测不到dlna(在同一wifi下为什么搜索不到设备)

  • 苹果手机用流量下载不了东西怎么办(苹果手机用流量下载软件超过200M怎么设置)

    苹果手机用流量下载不了东西怎么办(苹果手机用流量下载软件超过200M怎么设置)

  • 有网络为什么微信发不出去信息(有网络为什么微信发不出信息)

    有网络为什么微信发不出去信息(有网络为什么微信发不出信息)

  • 手机一直显示3g网怎么解决(手机一直显示3G 暂停服务)

    手机一直显示3g网怎么解决(手机一直显示3G 暂停服务)

  • 剪映怎么把视频和音乐对齐(剪映怎么把视频放慢)

    剪映怎么把视频和音乐对齐(剪映怎么把视频放慢)

  • 抖音把对方移出粉丝对方知道吗(抖音把对方移出黑名单后对方有提示吗)

    抖音把对方移出粉丝对方知道吗(抖音把对方移出黑名单后对方有提示吗)

  • 苹果3g运存相当于安卓多少(苹果3g运存相当安卓多少)

    苹果3g运存相当于安卓多少(苹果3g运存相当安卓多少)

  • 仅wifi播放在哪里关闭(怎么取消仅wifi下观看视频)

    仅wifi播放在哪里关闭(怎么取消仅wifi下观看视频)

  • 为啥我qq加别人不显示(为什么qq加上好友却不是好友)

    为啥我qq加别人不显示(为什么qq加上好友却不是好友)

  • 电脑wifi显示黄感叹号(电脑wifi显示黄灯)

    电脑wifi显示黄感叹号(电脑wifi显示黄灯)

  • 笔记本ctrl键被锁定(笔记本ctrl键被锁住怎么解锁)

    笔记本ctrl键被锁定(笔记本ctrl键被锁住怎么解锁)

  • 鸿蒙系统识别文字功能在哪? 鸿蒙提取图片文字的技巧(鸿蒙系统获取电脑文件)

    鸿蒙系统识别文字功能在哪? 鸿蒙提取图片文字的技巧(鸿蒙系统获取电脑文件)

  • 车船使用税新规2020
  • 会计运费怎么算的
  • 运输企业内账
  • 不入库的商品怎么做分录
  • 运输服务的增值税是多少
  • 实名制车票抵扣怎么操作
  • 现金盘亏无法查明原因计入什么科目
  • 红线范围外增加的工程量
  • 商誉减值可以抵税吗
  • 政策性搬迁资产损失情况怎么写
  • 剩余折旧月份
  • 预收账款年底要确认收入吗
  • 个体户季度报税表怎么填
  • 收到保险公司财产理赔款怎么做账
  • 政府机关开票是普票还是专票
  • 差旅费专用发票会计分录
  • 劳务公司的税率是多少经营模式
  • 分工分类法
  • 短期投资是会计准则吗
  • 进项税税额抵扣
  • 百货商场会计账怎么做
  • 借助的近义词
  • shnlog.exe - shnlog是什么进程 有什么用
  • 应付票据的核算方法有哪些
  • 办理发票缴销需要提供的资料
  • 产品成本计算的分类法适用于( )
  • mplugin.exe是什么
  • 网赚项目——Youtube获取高流量的技巧
  • 外贸企业出口免抵退
  • TypeError: Cannot read properties of null (reading ‘insertBefore‘) vue项目报错
  • 总结一些php中好用的软件
  • Zend Framework+smarty用法实例详解
  • 空调维修费进什么会计科目
  • 自制半成品属于原材料还是库存商品
  • 出售还在摊销的产品
  • 微信小程序slot
  • ORB_SLAM2+kinect稠密建图实战项目总结
  • 深度学习参数初始化(二)Kaiming初始化 含代码
  • gp_dump命令
  • linux用mv文件移动指定文件
  • 注册资本实缴后可以减资吗
  • 每个季度30万免增值税
  • 织梦cms怎么样
  • 预付费卡开票
  • 如何设置长期有效的二维码
  • mysql如何实现高性能读写
  • 什么时候贷主营业务成本
  • 外购商品用于宣传需要缴纳增值税吗
  • 什么是企业年金险
  • 什么是现金什么是现金流
  • 资本公积形成的原因有哪些
  • 不验资实收资本怎么做账
  • 会计的视频教程
  • 股东退股取现怎么处理
  • 预付账款转营业外支出
  • 临时设施属于什么科目
  • sqlserver日志已满
  • win7卸载程序找不到软件
  • windows优化软件
  • 不用光盘不用u盘怎么安装系统
  • 方正电脑升级
  • win10预览版21301bug
  • debian openssh
  • vmware tools安装包在哪
  • linux vps 教程
  • 安卓手机好用的笔记类app
  • opengl入门教程
  • fragment的context
  • jquery怎么判断复选框选中
  • unity3d,C#使用sqlite作为数据库解决方案思路
  • 《噩梦》
  • 狗刨怎么学
  • 江西省国家税务局电子税务局
  • 东莞税务申报日期
  • 关于出口退税的问题
  • 支部书记讲党课主题教育
  • 浙江省工伤停工留薪期分类目录
  • 百旺税控客服电话
  • 企业税收有哪些税种
  • 福建农村社保一个月可以拿多少钱
  • 免责声明:网站部分图片文字素材来源于网络,如有侵权,请及时告知,我们会第一时间删除,谢谢! 邮箱:opceo@qq.com

    鄂ICP备2023003026号

    网站地图: 企业信息 工商信息 财税知识 网络常识 编程技术

    友情链接: 武汉网站建设