位置: IT常识 - 正文

YOLOv7改进之二十二:涨点神器——引入递归门控卷积(gnConv)(yolox改进)

编辑:rootadmin
YOLOv7改进之二十二:涨点神器——引入递归门控卷积(gnConv)

推荐整理分享YOLOv7改进之二十二:涨点神器——引入递归门控卷积(gnConv)(yolox改进),希望有所帮助,仅作参考,欢迎阅读内容。

文章相关热门搜索词:yolov2改进,yolov5能从哪些方面改进,yolov3 改进,yolov5 改进,yolov3改进算法,yolov3 改进,yolov5 改进,yolov3 改进,内容如对您有帮助,希望把文章链接给更多的朋友!

 ​前 言:作为当前先进的深度学习目标检测算法YOLOv7,已经集合了大量的trick,但是还是有提高和改进的空间,针对具体应用场景下的检测难点,可以不同的改进方法。此后的系列文章,将重点对YOLOv7的如何改进进行详细的介绍,目的是为了给那些搞科研的同学需要创新点或者搞工程项目的朋友需要达到更好的效果提供自己的微薄帮助和参考。由于出到YOLOv7,YOLOv5算法2020年至今已经涌现出大量改进论文,这个不论对于搞科研的同学或者已经工作的朋友来说,研究的价值和新颖度都不太够了,为与时俱进,以后改进算法以YOLOv7为基础,此前YOLOv5改进方法在YOLOv7同样适用,所以继续YOLOv5系列改进的序号。另外改进方法在YOLOv5等其他算法同样可以适用进行改进。希望能够对大家有帮助。

解决问题:YOLOv7主干特征提取网络为CNN网络,CNN具有平移不变性和局部性,缺乏全局建模长距离建模的能力,引入自然语言处理领域的框架Transformer来形成CNN+Transformer架构,充分两者的优点,提高目标检测效果,本人经过实验,对小目标以及密集预测任务会有一定的提升效果。视觉 Transformers 的最新进展在基于点积 self-attention 的新空间建模机制驱动的各种任务中取得了巨大成功。递归门控卷积(gnConv),它通过门控卷积和递归设计执行高阶空间交互。新操作具有高度的灵活性和可定制性,它兼容各种卷积变体,并将自注意力中的二阶交互扩​​展到任意阶,而不会引入大量额外的计算。gnConv 可以作为一个即插即用的模块来改进各种视觉 Transformer 和基于卷积的模型。Transformer方法融合参考YOLOv5改进往期。

YOLOv5改进之十七:CNN+Transformer——融合Bottleneck Transformers_人工智能算法研究院的博客-CSDN博客

原理:

YOLOv7改进之二十二:涨点神器——引入递归门控卷积(gnConv)(yolox改进)

论文:https://arxiv.org/pdf/2207.14284.pdf

代码:GitHub - raoyongming/HorNet: HorNet: Efficient High-Order Spatial Interactions with Recursive Gated Convolutions

视觉变形金刚的最新进展在各种任务中都取得了巨大的成功由基于点积自注意力的新空间建模机制驱动。在本文中,我们展示了愿景变形金刚背后的关键要素,即输入自适应、长程和高阶空间交互,也可以使用基于卷积的框架有效地实现。我们提出递归门控卷积(gnConv),它通过门控卷积和递归设计执行高阶空间交互。新的操作高度灵活可定制,兼容各种卷积变体并将 self-attention 中的二阶交互扩​​展到任意阶,而无需引入大量额外的计算。 GnConv 可以作为即插即用模块来改进各种视觉变压器和基于卷积的模型。基于该操作,我们构建了一个新的通用视觉骨干家族 命名为 HorNet。 ImageNet分类、COCO对象的大量实验检测和 ADE20K 语义分割显示 HorNet 优于 Swin Transformers 和 ConvNeXt 具有相似的整体架构和训练配置。 HorNet 还显示出良好的可扩展性更多的训练数据和更大的模型大小。除了视觉编码器的有效性之外,我们还展示了 gnConv 可以应用于特定任务的解码器和以更少的计算持续提高密集预测性能。我们的结果表明,gnConv 可以成为可视化建模的新基础模块它有效地结合了视觉 Transformer 和 CNN 的优点

 项目部分代码如下:

class gnconv(nn.Module): def __init__(self, dim, order=5, gflayer=None, h=14, w=8, s=1.0): super().__init__() self.order = order self.dims = [dim // 2 ** i for i in range(order)] self.dims.reverse() self.proj_in = nn.Conv2d(dim, 2*dim, 1) if gflayer is None: self.dwconv = get_dwconv(sum(self.dims), 7, True) else: self.dwconv = gflayer(sum(self.dims), h=h, w=w) self.proj_out = nn.Conv2d(dim, dim, 1) self.pws = nn.ModuleList( [nn.Conv2d(self.dims[i], self.dims[i+1], 1) for i in range(order-1)] ) self.scale = s print('[gnconv]', order, 'order with dims=', self.dims, 'scale=%.4f'%self.scale)

结 果:本人在多个数据集上做了大量实验,针对不同的数据集效果不同,涨点明显。

预告一下:下一篇内容将继续分享深度学习算法相关改进方法。有兴趣的朋友可以关注一下我,有问题可以留言或者私聊我哦

PS:卷积的替换不仅仅是适用改进YOLOv5,也可以改进其他的YOLO网络以及目标检测网络,比如YOLOv7、v6、v4、v3,Faster rcnn ,ssd等。

最后,希望能互粉一下,做个朋友,一起学习交流。

本文链接地址:https://www.jiuchutong.com/zhishi/297649.html 转载请保留说明!

上一篇:【实战与杂谈】如何复活一个开源网站-游戏王卡片生成器(实战到底究竟是什么意思啊)

下一篇:MySQL面试题-锁相关(数据库锁面试题)

  • 海南增值税发票图片
  • 行政事业性收据发票记帐
  • 什么情况要缴印花税
  • 税额怎么调整
  • 豆制品属于农产品初加工吗
  • 综合所得申报如何手工填写信息
  • 深圳增值税发票选择确认平台使用
  • 购买租赁财产是什么意思
  • 固定资产没收到发票收到实物入账有什么风险
  • 税务评估补税如何入账处理合适?
  • 出口样品账务处理
  • 母子公司无偿划拨资产
  • 销售不同税率的货物会计处理
  • 公司还没有核税该如何进行业务汇款?
  • 通过无偿取得的成果
  • 上市公司个税手续流程
  • 利润表的企业所得税怎么查询
  • 企业以前年度的关联交易与预约定价安排
  • 小规模定期定额计税依据
  • 个人去税务局开票流程
  • 转让合同债权
  • 国家税务总局11号令
  • 小额零星业务上限是多少
  • 在建工程暂估入库的账务处理
  • 商品返点收入账务处理
  • 不征税发票的12个税种
  • 1697509246
  • 电脑换系统怎么备份软件
  • 穿越火线封号查询官网
  • 存出保证金的核算内容
  • phpswitch语句成绩判断
  • linux系统如何更改主机名
  • 股票交易税怎么算出来的
  • dotnetfx2.0
  • PHP:mcrypt_enc_get_block_size()的用法_Mcrypt函数
  • 如何区分货币财富和收入
  • 华硕11代笔记本装win10
  • 完美解决在ThinkPHP控制器中命名空间的问题
  • 固定资产闲置能报废吗
  • tomcat服务器在哪个位置
  • iis搭建网站教程win10
  • laravel 实例
  • 拍卖抵押车 卖不出去怎么办
  • 自产自销农产品免税备案取消
  • 几个项目可以合到一起招标吗
  • 小规模开工程款几个点
  • 销售并提供安装服务怎么开票
  • 即征即退收入不能税前扣除
  • 营业总收入包含什么
  • 税控盘有什么作用
  • 固定资产报废如何交增值税
  • 银行扣款能撤回吗
  • 应交税金包括哪些税费
  • 零余额帐户如何转出
  • 租赁车子
  • 2018年水利建设基金税率
  • MySql5.6使用validate password 插件加强密码强度的安装及使用方法
  • mysql单表10亿
  • sql2005生成脚本
  • MySQL 5.7 mysql command line client 使用命令详解
  • win7支持net.framework4.7.2
  • winxp回收站清空了怎么恢复
  • 苹果mac系统关机怎么关
  • win8系统修改密码
  • win8平板玩lol
  • mac vscode opengl
  • android游戏开发框架
  • 基于专业性的家校双向互动,需要家长的学校教育参与
  • 如何使用nodejs
  • 三个文件怎么汇总到一个里
  • python错误代码
  • unityshader
  • <script defer> defer 是什么意思
  • android studio中r文件在哪
  • jquery 遍历
  • 广东政务平台网上办事大厅
  • 国税地税发票编码查询
  • 企业调查表资金怎么填
  • 南通工伤网上申请流程
  • 天津市河东区税务局
  • 免责声明:网站部分图片文字素材来源于网络,如有侵权,请及时告知,我们会第一时间删除,谢谢! 邮箱:opceo@qq.com

    鄂ICP备2023003026号

    网站地图: 企业信息 工商信息 财税知识 网络常识 编程技术

    友情链接: 武汉网站建设