位置: IT常识 - 正文

【YOLOv7】主要改进点详解(yolov4参数设置)

编辑:rootadmin
【YOLOv7】主要改进点详解 文章目录YOLOv7介绍整体网络架构高效聚合网络重参数化卷积辅助头检测动态标签分配总结YOLOv7介绍

推荐整理分享【YOLOv7】主要改进点详解(yolov4参数设置),希望有所帮助,仅作参考,欢迎阅读内容。

文章相关热门搜索词:yolo v5改进,yolov5改进bifpn,yolov2改进,yolov2改进,yolov5改进bifpn,yolov3怎么改进,yolov3怎么改进,yolov5怎么改进,内容如对您有帮助,希望把文章链接给更多的朋友!

YOLOv7论文在上个月6号挂在了Arxiv上之后,引起了巨大轰动,短短一个月的时间,Github上就有了4.3k个Star。

从论文题目可以看出来,YOLOv7又是一个集大成者的杰作;从Github源码可以看出, 整体结构与YOLOv5极其相似,因此有YOLOov5基础的小伙伴可以无脑上手v7。

另外来看下v7的两位大牛作者,一作是 Chien-Yao Wang,近几年一直耕耘在目标检测领域,尤其是YOLO系列,代表作:YOLOv7、YOLOR、ScaledYOLOv4、CSPNet等。二作是 Alexey Bochkovskiy,就是在20年Joseph Redmon宣布退出CV领域后扛起YOLO系列大旗并发布YOLOv4的那位大神。  

整体网络架构

YOLOv7完整网络架构以及各组件的详细解析可以移步至:【YOLOv7_0.1】网络结构与源码解析,这里从另一个角度来了解YOLOov7的网络架构:

上面这张图是根据我目前的理解,对YOLOv7的整体结构进行的拆分,可能会有不正确的地方,欢迎各位小伙伴前来交流~

可以很清楚的看到,YOLOv7大部分继承自YOLOv5,包括整体网络架构、配置文件的设置和训练、推理、验证过程等等,基本上熟悉v5就可以无脑上手v7了;此外,v7也有不少继承自YOLOR,毕竟是同一个作者前后年的工作,包括不同网络的设计、超参数设置以及隐性知识学习的加入;还有就是在正样本匹配时仿照了YOLOX的SimOTA策略。

除了这些在已有YOLO版本中的算法之外,YOLOv7还包括了近几年最新的trick:高效聚合网络(目前论文还未接收)、重参数化卷积、辅助头检测、模型缩放等等,因此学习YOLOv7还是非常有价值的。  

高效聚合网络

图a和图b是之前常用的特征提取网络,图c则是YOLOv7主要用到的ELAN网络,虽然有引文,但是并没有任何详细资料来学习,对此,作者是这么说的:

ELAN paper will be released after accept at the latest.

好叭,那就再等等。图d是对ELAN的改进,其等效网络就是下面这个,也就是两个ELAN(红框里)的Concat,作者的解释是:

For E-ELAN architecture, since our edge device do not support group convolution and shuffle operation, we are forced to implement it as an equivalence architecture.

【YOLOv7】主要改进点详解(yolov4参数设置)

重参数化卷积

重参数化的作用:在保证模型性能的条件下加速网络,主要是对卷积+BN层以及不同卷积进行融合,合并为一个卷积模块。

下面给出了卷积+BN融合的公式化过程,红色表示卷积参数(权重和偏置),蓝色是BN参数(mmm是输入均值,vvv是输入标准差,γ\gammaγ和β\betaβ是两个可学习的参数),最终经过一系列化简,融合成了一个卷积:

在YOLOv7中,除了网络最后使用RepConv重参数化卷积之外,作者也提到了其他三处使用重参数化技巧的地方:

we perform reparameterization on conv-bn, repconv, orepa, and yolor.

对应model/yolo.py中model类的fuse函数(这里):

辅助头检测

YOLOv7中,将head部分的浅层特征提取出来作为Aux head(辅助头),深层特征也就是网络的最终输出作为Lead head(引导头),如图b所示。

在计算损失时:

图c的策略是,lead head和aux head分别、单独计算损失,最终相加图d的策略是,lead head单独计算损失,aux head将lead head匹配得到的正样本作为自己的正样本,并计算损失,最终相加(占比不同)图e的策略是,lead head单独计算损失,aux head将lead head匹配得到的正样本(这里是粗匹配,也就是选择GT框中心点所在网格的上下左右4个邻域网络作为正样本筛选区域)作为自己的正样本,并计算损失,最终相加(占比不同)

以training/yolov7-w6.yaml为例,最后detect模块的前四层为lead head,后四层为aux head,在推理时,只取前四层作为detect层的输出:

动态标签分配

YOLOv7的标签分配策略(正样本筛选),集成了YOLOv5和YOLOX两者的精华:

YOLOv5 Step1:Autoanchor策略,获得数据集最佳匹配的9个anchor(可选) Step2:根据GT框与anchor的宽高比,过滤掉不合适的anchor Step3:选择GT框的中心网格以及最邻近的2个邻域网格作为正样本筛选区域(辅助头则选择周围4个邻域网格)

YOLOX Step4:计算GT框与正样本IOU并从大到小排序,选取前10个值进行求和(P6前20个),并取整作为当前GT框的K值 Step5:根据损失函数计算每个GT框和候选anchor的损失,保留损失最小的前K个 Step6:去掉同一个anchor被分配到多个GT框的情况总结

概括:

YOLOv7在5FPS到160FPS的范围内,无论是速度或是精度,都超过了目前已知的检测器在V100上进行测试, 精度为56.8%AP的模型可达到30FPS(batch=1)以上的检测速率目前唯一一款在如此高精度下仍能超过30FPS的检测器

不足:

代码冗余,版本更新问题精度虚高(参考:如何评价AlexeyAB版的YOLOv7?)验证时数据预处理的图像缩放异常(没有做padding操作)验证时的NMS异常(应该是multi_label = False)

参考资料 目标检测算法——YOLOV7——详解 如何评价AlexeyAB版的YOLOv7?

本文链接地址:https://www.jiuchutong.com/zhishi/298384.html 转载请保留说明!

上一篇:R数据分析:临床预测模型中校准曲线和DCA曲线的意义与做法(r在数据分析中表示什么意思)

下一篇:查询数据库空间(mysql和oracle)(如何查询数据库表空间)

  • 魅族18x有光学防抖吗(魅族18有光学防抖吗?)

    魅族18x有光学防抖吗(魅族18有光学防抖吗?)

  • 苹果12promax有高刷吗(苹果12promax有高频调光吗)

    苹果12promax有高刷吗(苹果12promax有高频调光吗)

  • 乐播投屏码哪里获取(乐播投屏的投屏码在哪里找)

    乐播投屏码哪里获取(乐播投屏的投屏码在哪里找)

  • 毒app什么叫非鉴定范围(毒上的非鉴别范围是不是假货)

    毒app什么叫非鉴定范围(毒上的非鉴别范围是不是假货)

  • 限量秒杀时用wifi还是4g(限时秒杀流量大吗)

    限量秒杀时用wifi还是4g(限时秒杀流量大吗)

  • 文件中转站删除后空间仍不足(文件中转站删除后对方能下载吗)

    文件中转站删除后空间仍不足(文件中转站删除后对方能下载吗)

  • iphone11微信提示音怎么改(iphone11微信提示音怎么关)

    iphone11微信提示音怎么改(iphone11微信提示音怎么关)

  • excel单元格对齐方式在哪里(excel表格怎么锁定单元格)

    excel单元格对齐方式在哪里(excel表格怎么锁定单元格)

  • 虚拟运营商有哪些公司(虚拟运营商有哪些开头号码)

    虚拟运营商有哪些公司(虚拟运营商有哪些开头号码)

  • 手机信号旁边有个电话x(手机信号旁边有个感叹号是什么意思)

    手机信号旁边有个电话x(手机信号旁边有个感叹号是什么意思)

  • 为什么探探会发短信给我(为什么探探发动态没人看)

    为什么探探会发短信给我(为什么探探发动态没人看)

  • 缓存数据删除了会怎样(删除了缓存内容还可以恢复吗)

    缓存数据删除了会怎样(删除了缓存内容还可以恢复吗)

  • 菜鸟驿站身份码是什么(菜鸟驿站身份码截图有用吗)

    菜鸟驿站身份码是什么(菜鸟驿站身份码截图有用吗)

  • 情侣空间开不了怎么回事?(情侣空间为啥开不了)

    情侣空间开不了怎么回事?(情侣空间为啥开不了)

  • 小米手机4g标志不见了(小米手机4g标志怎么设置)

    小米手机4g标志不见了(小米手机4g标志怎么设置)

  • 小树pdf怎么卸载(小树pdf怎么卸载干净)

    小树pdf怎么卸载(小树pdf怎么卸载干净)

  • web应用系统的测试可分为(web应用系统设计的步骤)

    web应用系统的测试可分为(web应用系统设计的步骤)

  • 小米analytics能删吗(小米手机怎么删除小米社区)

    小米analytics能删吗(小米手机怎么删除小米社区)

  • 华为 Mate9怎么双清(华为mate9怎么双击屏幕唤醒)

    华为 Mate9怎么双清(华为mate9怎么双击屏幕唤醒)

  • iphone xr快充多少w(xr快充最高能达到多少w)

    iphone xr快充多少w(xr快充最高能达到多少w)

  • swt是什么意思(swtf)

    swt是什么意思(swtf)

  • macOSCatalina10.15.5Beta4值得升级吗 macOSCatalina10.15.5Beta4更新了什么

    macOSCatalina10.15.5Beta4值得升级吗 macOSCatalina10.15.5Beta4更新了什么

  • 【OpenCV-Python】:查找物体轮廓+计算轮廓面积、长度、重心(python的opencv)

    【OpenCV-Python】:查找物体轮廓+计算轮廓面积、长度、重心(python的opencv)

  • 只拿了营业执照十年无办税好注销吗
  • 企业收取的租金应当计入
  • 劳务费增值税专用发票税率是多少
  • 网上增值税申报表怎么填
  • 增值税发票丢了怎么办?
  • 水资源税怎么入账
  • 企业季度预缴所得税怎么账务处理
  • 注册资本没缴足可以注销吗
  • 工业企业会计错账处理方法有哪些
  • 计提长期债券利息分录怎么做
  • 出口退税的发票怎么做账
  • 奖品偶然所得个税如何申报
  • 银行承兑汇票向谁追索
  • 注册个人独资企业和有限公司哪个好
  • 劳务费发票和建筑劳务费发票
  • 核定征收未分配利润分红分录
  • 红字发票账务处理摘要
  • 免税发票可以抵多少税
  • 补缴企业所得税汇算清缴会计分录怎么做
  • 其他应付款质保金到期怎么附单据
  • 房租费可以计入研发费用加计扣除吗
  • 商业承兑汇票贴现为什么是短期借款
  • 小规模10万以下免税分录
  • 企业所得税以前年度亏损怎么弥补
  • 个税少扣了怎么账平掉
  • w11系统有哪些新功能
  • 权益法初始入账价值和初始投资成本
  • 什么时候不能计入开办费
  • 鸿蒙系统蓝牙耳机声音小怎么办
  • 都柏林圣三一学院图片
  • yolov5 test.py
  • 小程序的生命周期函数有哪些
  • 自动化测试三年规划
  • utermux命令
  • 纳税人在电子税务局收到优惠政策
  • 借入资金会计科目
  • 手机开的发票
  • 母子公司之间的租赁房屋
  • 融资租赁有免租金吗
  • 有什么学电脑的网站
  • 国税实名认证手机号如何解绑
  • 增值税专用发票和普通发票的区别
  • 2020新个税申报流程
  • 一般纳税人季报还是月报
  • 债务转化为资本是啥意思?
  • 政府补贴业务如何发放
  • 贴现的利息通过什么会计科目核算
  • 上期留抵税额可以留多久
  • 未使用的固定资产计提折旧计入什么科目
  • 个体工商户的纳税标准
  • 营业成本占营业收入的比重过高
  • 滞留专票会有什么风险
  • 帐薄和账簿区别
  • 分享一个简单的故事英语
  • MySql insert插入操作的3个小技巧分享
  • sqlserver2008r2创建实例
  • centos强制关闭程序
  • 无光驱是不是放不了光盘
  • explore.exe是什么意思
  • 删掉sam文件后无法开机
  • Win7旗舰版系统镜像文件
  • linux使用mv命令,结果文件不见了
  • node connect
  • android RecycleView 面试
  • 命令以管理员运行
  • pyqt用法
  • nodejs 异步任务队列
  • 字符串中指定字符变换
  • word文件排序乱怎么恢复
  • jquery checkbox的相关操作总结
  • JavaScript中的数据类型
  • jquery设置图片路径
  • python函数的方法
  • python安装基础教程
  • jquery图片
  • jquery 图片
  • android获取系统弹窗,自动点击
  • python字符类型有哪些
  • 企业自产自销农产品免税政策有哪些
  • 安徽国家税务局电话
  • 免责声明:网站部分图片文字素材来源于网络,如有侵权,请及时告知,我们会第一时间删除,谢谢! 邮箱:opceo@qq.com

    鄂ICP备2023003026号

    网站地图: 企业信息 工商信息 财税知识 网络常识 编程技术

    友情链接: 武汉网站建设