位置: IT常识 - 正文

【YOLOv7】主要改进点详解(yolov4参数设置)

编辑:rootadmin
【YOLOv7】主要改进点详解 文章目录YOLOv7介绍整体网络架构高效聚合网络重参数化卷积辅助头检测动态标签分配总结YOLOv7介绍

推荐整理分享【YOLOv7】主要改进点详解(yolov4参数设置),希望有所帮助,仅作参考,欢迎阅读内容。

文章相关热门搜索词:yolo v5改进,yolov5改进bifpn,yolov2改进,yolov2改进,yolov5改进bifpn,yolov3怎么改进,yolov3怎么改进,yolov5怎么改进,内容如对您有帮助,希望把文章链接给更多的朋友!

YOLOv7论文在上个月6号挂在了Arxiv上之后,引起了巨大轰动,短短一个月的时间,Github上就有了4.3k个Star。

从论文题目可以看出来,YOLOv7又是一个集大成者的杰作;从Github源码可以看出, 整体结构与YOLOv5极其相似,因此有YOLOov5基础的小伙伴可以无脑上手v7。

另外来看下v7的两位大牛作者,一作是 Chien-Yao Wang,近几年一直耕耘在目标检测领域,尤其是YOLO系列,代表作:YOLOv7、YOLOR、ScaledYOLOv4、CSPNet等。二作是 Alexey Bochkovskiy,就是在20年Joseph Redmon宣布退出CV领域后扛起YOLO系列大旗并发布YOLOv4的那位大神。  

整体网络架构

YOLOv7完整网络架构以及各组件的详细解析可以移步至:【YOLOv7_0.1】网络结构与源码解析,这里从另一个角度来了解YOLOov7的网络架构:

上面这张图是根据我目前的理解,对YOLOv7的整体结构进行的拆分,可能会有不正确的地方,欢迎各位小伙伴前来交流~

可以很清楚的看到,YOLOv7大部分继承自YOLOv5,包括整体网络架构、配置文件的设置和训练、推理、验证过程等等,基本上熟悉v5就可以无脑上手v7了;此外,v7也有不少继承自YOLOR,毕竟是同一个作者前后年的工作,包括不同网络的设计、超参数设置以及隐性知识学习的加入;还有就是在正样本匹配时仿照了YOLOX的SimOTA策略。

除了这些在已有YOLO版本中的算法之外,YOLOv7还包括了近几年最新的trick:高效聚合网络(目前论文还未接收)、重参数化卷积、辅助头检测、模型缩放等等,因此学习YOLOv7还是非常有价值的。  

高效聚合网络

图a和图b是之前常用的特征提取网络,图c则是YOLOv7主要用到的ELAN网络,虽然有引文,但是并没有任何详细资料来学习,对此,作者是这么说的:

ELAN paper will be released after accept at the latest.

好叭,那就再等等。图d是对ELAN的改进,其等效网络就是下面这个,也就是两个ELAN(红框里)的Concat,作者的解释是:

For E-ELAN architecture, since our edge device do not support group convolution and shuffle operation, we are forced to implement it as an equivalence architecture.

【YOLOv7】主要改进点详解(yolov4参数设置)

重参数化卷积

重参数化的作用:在保证模型性能的条件下加速网络,主要是对卷积+BN层以及不同卷积进行融合,合并为一个卷积模块。

下面给出了卷积+BN融合的公式化过程,红色表示卷积参数(权重和偏置),蓝色是BN参数(mmm是输入均值,vvv是输入标准差,γ\gammaγ和β\betaβ是两个可学习的参数),最终经过一系列化简,融合成了一个卷积:

在YOLOv7中,除了网络最后使用RepConv重参数化卷积之外,作者也提到了其他三处使用重参数化技巧的地方:

we perform reparameterization on conv-bn, repconv, orepa, and yolor.

对应model/yolo.py中model类的fuse函数(这里):

辅助头检测

YOLOv7中,将head部分的浅层特征提取出来作为Aux head(辅助头),深层特征也就是网络的最终输出作为Lead head(引导头),如图b所示。

在计算损失时:

图c的策略是,lead head和aux head分别、单独计算损失,最终相加图d的策略是,lead head单独计算损失,aux head将lead head匹配得到的正样本作为自己的正样本,并计算损失,最终相加(占比不同)图e的策略是,lead head单独计算损失,aux head将lead head匹配得到的正样本(这里是粗匹配,也就是选择GT框中心点所在网格的上下左右4个邻域网络作为正样本筛选区域)作为自己的正样本,并计算损失,最终相加(占比不同)

以training/yolov7-w6.yaml为例,最后detect模块的前四层为lead head,后四层为aux head,在推理时,只取前四层作为detect层的输出:

动态标签分配

YOLOv7的标签分配策略(正样本筛选),集成了YOLOv5和YOLOX两者的精华:

YOLOv5 Step1:Autoanchor策略,获得数据集最佳匹配的9个anchor(可选) Step2:根据GT框与anchor的宽高比,过滤掉不合适的anchor Step3:选择GT框的中心网格以及最邻近的2个邻域网格作为正样本筛选区域(辅助头则选择周围4个邻域网格)

YOLOX Step4:计算GT框与正样本IOU并从大到小排序,选取前10个值进行求和(P6前20个),并取整作为当前GT框的K值 Step5:根据损失函数计算每个GT框和候选anchor的损失,保留损失最小的前K个 Step6:去掉同一个anchor被分配到多个GT框的情况总结

概括:

YOLOv7在5FPS到160FPS的范围内,无论是速度或是精度,都超过了目前已知的检测器在V100上进行测试, 精度为56.8%AP的模型可达到30FPS(batch=1)以上的检测速率目前唯一一款在如此高精度下仍能超过30FPS的检测器

不足:

代码冗余,版本更新问题精度虚高(参考:如何评价AlexeyAB版的YOLOv7?)验证时数据预处理的图像缩放异常(没有做padding操作)验证时的NMS异常(应该是multi_label = False)

参考资料 目标检测算法——YOLOV7——详解 如何评价AlexeyAB版的YOLOv7?

本文链接地址:https://www.jiuchutong.com/zhishi/298384.html 转载请保留说明!

上一篇:R数据分析:临床预测模型中校准曲线和DCA曲线的意义与做法(r在数据分析中表示什么意思)

下一篇:查询数据库空间(mysql和oracle)(如何查询数据库表空间)

  • 国家卫健委医政司司长焦雅辉:新冠确实不是大号感冒

    国家卫健委医政司司长焦雅辉:新冠确实不是大号感冒

  • iqoo8pro中框是什么材质(iqoopro中框多少钱)

    iqoo8pro中框是什么材质(iqoopro中框多少钱)

  • 米游社讨论区签到在哪(米游社讨论区签到奖励)

    米游社讨论区签到在哪(米游社讨论区签到奖励)

  • 腾讯微视可以进行直播吗(腾讯微视有直播功能吗)

    腾讯微视可以进行直播吗(腾讯微视有直播功能吗)

  • 荣耀30s权益版什么意思(荣耀30权益查询在哪个地方)

    荣耀30s权益版什么意思(荣耀30权益查询在哪个地方)

  • 为什么微信发现里面没有视频号(为什么微信发现里没有朋友圈)

    为什么微信发现里面没有视频号(为什么微信发现里没有朋友圈)

  • 转发别人的抖音视频别人能看到吗(转发别人的抖音视频怎么变小了)

    转发别人的抖音视频别人能看到吗(转发别人的抖音视频怎么变小了)

  • mivideo文件夹可以删除吗(miguvideo是什么文件夹)

    mivideo文件夹可以删除吗(miguvideo是什么文件夹)

  • 红米k20pro能无线充电吗(红米k20prowifi)

    红米k20pro能无线充电吗(红米k20prowifi)

  • 苹果如何调出悬浮球(苹果如何调出悬浮球图标)

    苹果如何调出悬浮球(苹果如何调出悬浮球图标)

  • 微信可以有两个账号吗(微信可以有两个头像吗)

    微信可以有两个账号吗(微信可以有两个头像吗)

  • 手提电脑怎么还原系统(手提电脑还原系统按哪个键)

    手提电脑怎么还原系统(手提电脑还原系统按哪个键)

  • 抖音号怎样注销账号(抖音号怎样注销的)

    抖音号怎样注销账号(抖音号怎样注销的)

  • word为什么编辑不了(word为什么编辑不了公式)

    word为什么编辑不了(word为什么编辑不了公式)

  • 数据预处理常见的几种方法(数据预处理常见问题)

    数据预处理常见的几种方法(数据预处理常见问题)

  • 联想电脑开机按哪个键(联想电脑开机按F12没反应)

    联想电脑开机按哪个键(联想电脑开机按F12没反应)

  • vsco怎么保存配方(vsco如何保存十个以上配方)

    vsco怎么保存配方(vsco如何保存十个以上配方)

  • 小米6耳机插上还是外放(小米6耳机插上没有声音)

    小米6耳机插上还是外放(小米6耳机插上没有声音)

  • 安卓手机数据怎么转移苹果手机里(安卓手机数据怎么导入安卓手机)

    安卓手机数据怎么转移苹果手机里(安卓手机数据怎么导入安卓手机)

  • oppo手机里的照片怎么转移到U盘(oppo手机里的照片怎么传到电脑里)

    oppo手机里的照片怎么转移到U盘(oppo手机里的照片怎么传到电脑里)

  • videoleap怎么设置照片秒数(videoleap怎么设置字幕)

    videoleap怎么设置照片秒数(videoleap怎么设置字幕)

  • 华为p30pro多重(华为p30PrO多重多少g)

    华为p30pro多重(华为p30PrO多重多少g)

  • qqprotect.exe是什么进程?qqprotect.exe怎么禁止自动启动?

    qqprotect.exe是什么进程?qqprotect.exe怎么禁止自动启动?

  • CLIP模型(CLIP模型原理)

    CLIP模型(CLIP模型原理)

  • dede 织梦编辑框显示不出来的问题(织梦内容页模板修改)

    dede 织梦编辑框显示不出来的问题(织梦内容页模板修改)

  • 企业的企业所得税
  • 个体工商户怎么补交个人所得税
  • 工资个税计算公式2020
  • 清算组的性质
  • 子公司向母公司借款利息税务处理
  • 纳税申报操作流程
  • 支付给个人的佣金费用需要发票吗
  • 税金及附加有啥
  • 专用发票网上勾选不了
  • 请客户旅游算不算贿赂
  • 资产报废变现收入应开具哪种发票
  • 政府搬迁补偿款记资本公积
  • 事假扣薪
  • 案例分析一般纳税人的税负率怎么计算?
  • 普通发票红字冲销,需要退回原发票吗
  • 所得税申报表中利润总额是怎样算出来的
  • 委托贷款合同效力
  • 怎么进行现金流量分析
  • 包工不包料都包括什么
  • 积分全部换购商品是什么
  • bios设置独立显卡优先启动
  • 外观设计专利费减
  • 监事会成员是什么人
  • win7关机提示
  • 抵扣后增值税税率
  • 支付货款的流程
  • 律师费怎样入账
  • 个人所得税的征收模式为()A分类征收B综合征收C
  • 后台管理系统权限管理详解
  • php制作验证码
  • php+mysql+ajax实现单表多字段多关键词查询的方法
  • 微服务架构java框架
  • 房产税为什么会退税
  • 网络工程师笔记大全
  • laravel artisan命令
  • elementui 手机端
  • 学人工智能哪家机构比较好
  • Android AsyncTack 异步任务实例详解
  • 利润分配财务管理
  • 关于英语的25个单词
  • 阴影等级是什么
  • vue动态修改scss变量
  • 会计成本应如何结转
  • 支付给租户的装修押金
  • 资产负债表日后事项是什么意思?
  • 代销手续费未付怎么处理
  • 电子发票如何申领取电子发票
  • MySQL的主从复制基于什么实现的?
  • 个体工商户怎么开发票
  • 金税四期对企业纳税管理影响分析
  • 增值税专用发票查询系统官方网站
  • 误餐补助需要提供发票吗
  • 不动产进项税额分期抵扣暂行办法还有效吗
  • 先开票后出库会计处理
  • 销项负数发票是红字发票吗
  • 财务报表中的存货包括哪些内容
  • 汇算清缴退费怎么入账
  • 残保金新公司第一年免费吗
  • 日常修理费用如何记账
  • sql语句压缩
  • win7小技巧
  • freebsd的软件多吗
  • 手动防止Ping攻击方法(无需防火墙)
  • 更新win8
  • ubuntu 20.04桌面
  • 使用标准用户帐号的方法
  • win10系统自带的浏览器叫什么
  • 在windows xp
  • centos7.4安装
  • RedHatLinux AS3中APACHE+SendMail+OpenWebMail整合
  • win8系统没有声音怎么办
  • 嗌中怎么读
  • Linux查看所有用户和密码
  • dos命令怎么写
  • 详解杭州亚运会会徽和口号
  • javascript document.execCommand() 常用解析
  • 水电费收税
  • 企业年金可以补办吗
  • 教育培训行业的前景
  • 中山税务如何预约
  • 免责声明:网站部分图片文字素材来源于网络,如有侵权,请及时告知,我们会第一时间删除,谢谢! 邮箱:opceo@qq.com

    鄂ICP备2023003026号

    网站地图: 企业信息 工商信息 财税知识 网络常识 编程技术

    友情链接: 武汉网站建设