位置: IT常识 - 正文

【YOLOv7】主要改进点详解(yolov4参数设置)

编辑:rootadmin
【YOLOv7】主要改进点详解 文章目录YOLOv7介绍整体网络架构高效聚合网络重参数化卷积辅助头检测动态标签分配总结YOLOv7介绍

推荐整理分享【YOLOv7】主要改进点详解(yolov4参数设置),希望有所帮助,仅作参考,欢迎阅读内容。

文章相关热门搜索词:yolo v5改进,yolov5改进bifpn,yolov2改进,yolov2改进,yolov5改进bifpn,yolov3怎么改进,yolov3怎么改进,yolov5怎么改进,内容如对您有帮助,希望把文章链接给更多的朋友!

YOLOv7论文在上个月6号挂在了Arxiv上之后,引起了巨大轰动,短短一个月的时间,Github上就有了4.3k个Star。

从论文题目可以看出来,YOLOv7又是一个集大成者的杰作;从Github源码可以看出, 整体结构与YOLOv5极其相似,因此有YOLOov5基础的小伙伴可以无脑上手v7。

另外来看下v7的两位大牛作者,一作是 Chien-Yao Wang,近几年一直耕耘在目标检测领域,尤其是YOLO系列,代表作:YOLOv7、YOLOR、ScaledYOLOv4、CSPNet等。二作是 Alexey Bochkovskiy,就是在20年Joseph Redmon宣布退出CV领域后扛起YOLO系列大旗并发布YOLOv4的那位大神。  

整体网络架构

YOLOv7完整网络架构以及各组件的详细解析可以移步至:【YOLOv7_0.1】网络结构与源码解析,这里从另一个角度来了解YOLOov7的网络架构:

上面这张图是根据我目前的理解,对YOLOv7的整体结构进行的拆分,可能会有不正确的地方,欢迎各位小伙伴前来交流~

可以很清楚的看到,YOLOv7大部分继承自YOLOv5,包括整体网络架构、配置文件的设置和训练、推理、验证过程等等,基本上熟悉v5就可以无脑上手v7了;此外,v7也有不少继承自YOLOR,毕竟是同一个作者前后年的工作,包括不同网络的设计、超参数设置以及隐性知识学习的加入;还有就是在正样本匹配时仿照了YOLOX的SimOTA策略。

除了这些在已有YOLO版本中的算法之外,YOLOv7还包括了近几年最新的trick:高效聚合网络(目前论文还未接收)、重参数化卷积、辅助头检测、模型缩放等等,因此学习YOLOv7还是非常有价值的。  

高效聚合网络

图a和图b是之前常用的特征提取网络,图c则是YOLOv7主要用到的ELAN网络,虽然有引文,但是并没有任何详细资料来学习,对此,作者是这么说的:

ELAN paper will be released after accept at the latest.

好叭,那就再等等。图d是对ELAN的改进,其等效网络就是下面这个,也就是两个ELAN(红框里)的Concat,作者的解释是:

For E-ELAN architecture, since our edge device do not support group convolution and shuffle operation, we are forced to implement it as an equivalence architecture.

【YOLOv7】主要改进点详解(yolov4参数设置)

重参数化卷积

重参数化的作用:在保证模型性能的条件下加速网络,主要是对卷积+BN层以及不同卷积进行融合,合并为一个卷积模块。

下面给出了卷积+BN融合的公式化过程,红色表示卷积参数(权重和偏置),蓝色是BN参数(mmm是输入均值,vvv是输入标准差,γ\gammaγ和β\betaβ是两个可学习的参数),最终经过一系列化简,融合成了一个卷积:

在YOLOv7中,除了网络最后使用RepConv重参数化卷积之外,作者也提到了其他三处使用重参数化技巧的地方:

we perform reparameterization on conv-bn, repconv, orepa, and yolor.

对应model/yolo.py中model类的fuse函数(这里):

辅助头检测

YOLOv7中,将head部分的浅层特征提取出来作为Aux head(辅助头),深层特征也就是网络的最终输出作为Lead head(引导头),如图b所示。

在计算损失时:

图c的策略是,lead head和aux head分别、单独计算损失,最终相加图d的策略是,lead head单独计算损失,aux head将lead head匹配得到的正样本作为自己的正样本,并计算损失,最终相加(占比不同)图e的策略是,lead head单独计算损失,aux head将lead head匹配得到的正样本(这里是粗匹配,也就是选择GT框中心点所在网格的上下左右4个邻域网络作为正样本筛选区域)作为自己的正样本,并计算损失,最终相加(占比不同)

以training/yolov7-w6.yaml为例,最后detect模块的前四层为lead head,后四层为aux head,在推理时,只取前四层作为detect层的输出:

动态标签分配

YOLOv7的标签分配策略(正样本筛选),集成了YOLOv5和YOLOX两者的精华:

YOLOv5 Step1:Autoanchor策略,获得数据集最佳匹配的9个anchor(可选) Step2:根据GT框与anchor的宽高比,过滤掉不合适的anchor Step3:选择GT框的中心网格以及最邻近的2个邻域网格作为正样本筛选区域(辅助头则选择周围4个邻域网格)

YOLOX Step4:计算GT框与正样本IOU并从大到小排序,选取前10个值进行求和(P6前20个),并取整作为当前GT框的K值 Step5:根据损失函数计算每个GT框和候选anchor的损失,保留损失最小的前K个 Step6:去掉同一个anchor被分配到多个GT框的情况总结

概括:

YOLOv7在5FPS到160FPS的范围内,无论是速度或是精度,都超过了目前已知的检测器在V100上进行测试, 精度为56.8%AP的模型可达到30FPS(batch=1)以上的检测速率目前唯一一款在如此高精度下仍能超过30FPS的检测器

不足:

代码冗余,版本更新问题精度虚高(参考:如何评价AlexeyAB版的YOLOv7?)验证时数据预处理的图像缩放异常(没有做padding操作)验证时的NMS异常(应该是multi_label = False)

参考资料 目标检测算法——YOLOV7——详解 如何评价AlexeyAB版的YOLOv7?

本文链接地址:https://www.jiuchutong.com/zhishi/298384.html 转载请保留说明!

上一篇:R数据分析:临床预测模型中校准曲线和DCA曲线的意义与做法(r在数据分析中表示什么意思)

下一篇:查询数据库空间(mysql和oracle)(如何查询数据库表空间)

  • dareu键盘灯光怎么切换(dareu键盘灯光怎么调亮度)

    dareu键盘灯光怎么切换(dareu键盘灯光怎么调亮度)

  • 钉钉如何家长和孩子同时使用(钉钉如何家长和孩子共享)

    钉钉如何家长和孩子同时使用(钉钉如何家长和孩子共享)

  • 华为nova9耳机孔在哪里(华为nova9耳机孔为什么小)

    华为nova9耳机孔在哪里(华为nova9耳机孔为什么小)

  • 消息发出但被对方拒收了是被拉黑了吗(消息发出但被对方拒绝了是什么意思)

    消息发出但被对方拒收了是被拉黑了吗(消息发出但被对方拒绝了是什么意思)

  • vivos7和vivox50的区别有哪些(vivos7和vivix50哪个好)

    vivos7和vivox50的区别有哪些(vivos7和vivix50哪个好)

  • 微信视频怎么自定义铃声(微信视频怎么自动挂断)

    微信视频怎么自定义铃声(微信视频怎么自动挂断)

  • k20pro前置相机弹出失败(k20p前置摄像头弹不出)

    k20pro前置相机弹出失败(k20p前置摄像头弹不出)

  • 小米手机刷机后怎么恢复原来的数据(小米手机刷机后开不了机怎么办)

    小米手机刷机后怎么恢复原来的数据(小米手机刷机后开不了机怎么办)

  • 荣耀hry-al00a什么型号(荣耀hry-al00a手机)

    荣耀hry-al00a什么型号(荣耀hry-al00a手机)

  • 直播画面镜像什么意思(直播的时候镜像怎么处理)

    直播画面镜像什么意思(直播的时候镜像怎么处理)

  • 小米10青春版怎么装卡(小米10青春版怎么开启小窗口)

    小米10青春版怎么装卡(小米10青春版怎么开启小窗口)

  • 公众号是干嘛的(公众号是什么东西)

    公众号是干嘛的(公众号是什么东西)

  • 美版kindle pw4和国行差别(kindle pw4美版和国行区别)

    美版kindle pw4和国行差别(kindle pw4美版和国行区别)

  • 谷歌商店点登录没反应(谷歌商店点登录没反应怎么解决vivo)

    谷歌商店点登录没反应(谷歌商店点登录没反应怎么解决vivo)

  • 淘宝一口价改了对店铺影响大吗(淘宝一口价改了后多久可以恢复权重)

    淘宝一口价改了对店铺影响大吗(淘宝一口价改了后多久可以恢复权重)

  • ps的渐变工具在哪(ps中的渐变工具在哪里)

    ps的渐变工具在哪(ps中的渐变工具在哪里)

  • 58同城怎么关自动发送的消息(58同城怎么关自动回复消息)

    58同城怎么关自动发送的消息(58同城怎么关自动回复消息)

  • 苹果6s扩容有什么影响(苹果6s扩容有什么用)

    苹果6s扩容有什么影响(苹果6s扩容有什么用)

  • 如何关闭小爱语音引擎(如何关闭小爱语音搜索功能)

    如何关闭小爱语音引擎(如何关闭小爱语音搜索功能)

  • 拼多多怎样取消待拼团(拼多多怎样取消免密支付功能)

    拼多多怎样取消待拼团(拼多多怎样取消免密支付功能)

  • ipadpro10.5电池容量(ipadpro10.5英寸电池容量)

    ipadpro10.5电池容量(ipadpro10.5英寸电池容量)

  • appdata移动到其他盘方法(appdata如何移动)

    appdata移动到其他盘方法(appdata如何移动)

  • 【JavaScript】手撕前端面试题:寄生组合式继承 | 发布订阅模式 | 观察者模式(javascript中文手册)

    【JavaScript】手撕前端面试题:寄生组合式继承 | 发布订阅模式 | 观察者模式(javascript中文手册)

  • ntpdc命令  查询NTP守护进程(查看ntpdate状态)

    ntpdc命令 查询NTP守护进程(查看ntpdate状态)

  • phpcms v9如何关闭缓存(关闭php报错)

    phpcms v9如何关闭缓存(关闭php报错)

  • 增值税纳税申报表电子版在哪下载
  • 进出口贸易公司需要什么资质
  • 企业增资后需要交什么税
  • 农副产品增值税免税政策
  • 小规模自开专票怎么交税
  • 已认证的进项税发票要退回,怎么操作
  • 保险中介的保险可以买吗
  • 转让土地使用权属于销售无形资产吗
  • 物流运输途中损坏怎么办
  • 现金出资可以吗
  • 高速公路通行费电子发票怎么打印
  • 租房提取的话可以全部提取吗
  • 结转待转销项税额
  • 公司食堂买菜入什么科目
  • 新个税申报身份怎么填
  • 小规模计提季度怎么算
  • 代理运输协议范本
  • 筹建人员是什么工作
  • 付货款时从货款中扣除的返利怎样做账?
  • 收取拆迁补偿费会计分录
  • macbookpro磁盘需要分区吗
  • 药店 医保收入占比
  • 补缴以前年度附加税
  • 暂估入库怎么暂估
  • 病毒变种太多
  • 经营性支出属于哪个科目
  • 备用金借款有利息吗
  • 融资租入的设备为什么属于资产
  • 公司转让自建厂房怎么办
  • 免抵退税务处理
  • bios 和 uefi
  • 房屋装修固定家具是否计入房产税
  • 现金日记账的填制要求
  • 没有资质证书的公司可靠吗?
  • 会计凭证附件规范要求
  • php类的特性实例是什么
  • init 6命令
  • 计提工会经费的标准
  • 帝国cms为什么安装不了
  • 小企业会计准则外币业务
  • 物业费税目
  • 打车费属于差旅费吗
  • mysql5.6允许远程连接
  • 发票未到已付款怎么入账
  • 社会团体会费票据查询
  • SQL Server解析XML数据的方法详解
  • 销售bu是什么意思
  • 应交税金应交增值税年底转平吗
  • 通信服务费账务处理流程
  • 简易征收的进项税额转出
  • 收到的发票未抵税怎么办
  • 关税进口增值税缴纳时间
  • 商家代金券谁出钱
  • 管家婆进货单科目名称怎么录入?
  • 材料采购是什么会计要素
  • 小规模纳税人月销售额超过10万怎么交税
  • 营业税包含
  • 资金占用利息收入怎么入账
  • 企业预付账款的分录
  • MySQL MEM_ROOT详解及实例代码
  • centosrpm安装
  • windowsserver2008无线网不能连接
  • win7无法安装谷歌
  • linux 下VSFTP 530 Permission denied错误的解决方法
  • centos 7.2安装
  • 王者自动更新怎么关
  • 格式化不干净
  • realshed.exe - realshed是什么进程 有什么用
  • win10专业版系统多少g
  • windows2008无法识别usb
  • 程序员基本入门知识
  • AddForceAtPosition方法:增加刚体点作用力
  • opencv for linux
  • Unity3D游戏开发(第2版)pdf
  • python连接mq
  • js中alert怎么用
  • 国家税务总局12366纳税服务平台
  • 小规模纳税人一年开票额度是多少
  • 稳岗补贴是否需要发放
  • 独立的法人企业
  • 免责声明:网站部分图片文字素材来源于网络,如有侵权,请及时告知,我们会第一时间删除,谢谢! 邮箱:opceo@qq.com

    鄂ICP备2023003026号

    网站地图: 企业信息 工商信息 财税知识 网络常识 编程技术

    友情链接: 武汉网站建设