位置: IT常识 - 正文

YOLOv7改进之二十二:涨点神器——引入递归门控卷积(gnConv)(yolox改进)

编辑:rootadmin
YOLOv7改进之二十二:涨点神器——引入递归门控卷积(gnConv)

推荐整理分享YOLOv7改进之二十二:涨点神器——引入递归门控卷积(gnConv)(yolox改进),希望有所帮助,仅作参考,欢迎阅读内容。

文章相关热门搜索词:yolov2改进,yolov5能从哪些方面改进,yolov3 改进,yolov5 改进,yolov3改进算法,yolov3 改进,yolov5 改进,yolov3 改进,内容如对您有帮助,希望把文章链接给更多的朋友!

 ​前 言:作为当前先进的深度学习目标检测算法YOLOv7,已经集合了大量的trick,但是还是有提高和改进的空间,针对具体应用场景下的检测难点,可以不同的改进方法。此后的系列文章,将重点对YOLOv7的如何改进进行详细的介绍,目的是为了给那些搞科研的同学需要创新点或者搞工程项目的朋友需要达到更好的效果提供自己的微薄帮助和参考。由于出到YOLOv7,YOLOv5算法2020年至今已经涌现出大量改进论文,这个不论对于搞科研的同学或者已经工作的朋友来说,研究的价值和新颖度都不太够了,为与时俱进,以后改进算法以YOLOv7为基础,此前YOLOv5改进方法在YOLOv7同样适用,所以继续YOLOv5系列改进的序号。另外改进方法在YOLOv5等其他算法同样可以适用进行改进。希望能够对大家有帮助。

解决问题:YOLOv7主干特征提取网络为CNN网络,CNN具有平移不变性和局部性,缺乏全局建模长距离建模的能力,引入自然语言处理领域的框架Transformer来形成CNN+Transformer架构,充分两者的优点,提高目标检测效果,本人经过实验,对小目标以及密集预测任务会有一定的提升效果。视觉 Transformers 的最新进展在基于点积 self-attention 的新空间建模机制驱动的各种任务中取得了巨大成功。递归门控卷积(gnConv),它通过门控卷积和递归设计执行高阶空间交互。新操作具有高度的灵活性和可定制性,它兼容各种卷积变体,并将自注意力中的二阶交互扩​​展到任意阶,而不会引入大量额外的计算。gnConv 可以作为一个即插即用的模块来改进各种视觉 Transformer 和基于卷积的模型。Transformer方法融合参考YOLOv5改进往期。

YOLOv5改进之十七:CNN+Transformer——融合Bottleneck Transformers_人工智能算法研究院的博客-CSDN博客

原理:

YOLOv7改进之二十二:涨点神器——引入递归门控卷积(gnConv)(yolox改进)

论文:https://arxiv.org/pdf/2207.14284.pdf

代码:GitHub - raoyongming/HorNet: HorNet: Efficient High-Order Spatial Interactions with Recursive Gated Convolutions

视觉变形金刚的最新进展在各种任务中都取得了巨大的成功由基于点积自注意力的新空间建模机制驱动。在本文中,我们展示了愿景变形金刚背后的关键要素,即输入自适应、长程和高阶空间交互,也可以使用基于卷积的框架有效地实现。我们提出递归门控卷积(gnConv),它通过门控卷积和递归设计执行高阶空间交互。新的操作高度灵活可定制,兼容各种卷积变体并将 self-attention 中的二阶交互扩​​展到任意阶,而无需引入大量额外的计算。 GnConv 可以作为即插即用模块来改进各种视觉变压器和基于卷积的模型。基于该操作,我们构建了一个新的通用视觉骨干家族 命名为 HorNet。 ImageNet分类、COCO对象的大量实验检测和 ADE20K 语义分割显示 HorNet 优于 Swin Transformers 和 ConvNeXt 具有相似的整体架构和训练配置。 HorNet 还显示出良好的可扩展性更多的训练数据和更大的模型大小。除了视觉编码器的有效性之外,我们还展示了 gnConv 可以应用于特定任务的解码器和以更少的计算持续提高密集预测性能。我们的结果表明,gnConv 可以成为可视化建模的新基础模块它有效地结合了视觉 Transformer 和 CNN 的优点

 项目部分代码如下:

class gnconv(nn.Module): def __init__(self, dim, order=5, gflayer=None, h=14, w=8, s=1.0): super().__init__() self.order = order self.dims = [dim // 2 ** i for i in range(order)] self.dims.reverse() self.proj_in = nn.Conv2d(dim, 2*dim, 1) if gflayer is None: self.dwconv = get_dwconv(sum(self.dims), 7, True) else: self.dwconv = gflayer(sum(self.dims), h=h, w=w) self.proj_out = nn.Conv2d(dim, dim, 1) self.pws = nn.ModuleList( [nn.Conv2d(self.dims[i], self.dims[i+1], 1) for i in range(order-1)] ) self.scale = s print('[gnconv]', order, 'order with dims=', self.dims, 'scale=%.4f'%self.scale)

结 果:本人在多个数据集上做了大量实验,针对不同的数据集效果不同,涨点明显。

预告一下:下一篇内容将继续分享深度学习算法相关改进方法。有兴趣的朋友可以关注一下我,有问题可以留言或者私聊我哦

PS:卷积的替换不仅仅是适用改进YOLOv5,也可以改进其他的YOLO网络以及目标检测网络,比如YOLOv7、v6、v4、v3,Faster rcnn ,ssd等。

最后,希望能互粉一下,做个朋友,一起学习交流。

本文链接地址:https://www.jiuchutong.com/zhishi/297649.html 转载请保留说明!

上一篇:【实战与杂谈】如何复活一个开源网站-游戏王卡片生成器(实战到底究竟是什么意思啊)

下一篇:MySQL面试题-锁相关(数据库锁面试题)

  • 职工薪酬纳税调减的情况
  • 公司和劳务公司合作工资代发
  • 交易性金融资产属于什么科目
  • 上市公司收购其他公司要多久
  • 出售股票公允价值变动在借方
  • 法人的投资款如何拿出来
  • 企业购买用于绿化的土地
  • 原材料采用实际成本法核算
  • 模具维修费用清单表格
  • 服务业工资计入成本还是营业费用
  • 不能取得进项发票但结转成本,税务说明怎么写
  • 企业自产自用需要交增值税吗
  • 税控维护费发票图片
  • 长期待摊费用原值怎么填
  • 金融企业贷款损失税前扣除
  • 建筑企业包工包料
  • 拆迁安置土地的补偿标准
  • 什么是销售利润率和成本利润率
  • 如何申请残疾人
  • 广告业财政拨款包括哪些
  • 关于临时工工资标准的规定
  • 跨区域涉税事项报告表报验流程
  • 在建工程进项税额转出
  • 应交所得税和所得税费用的区别计算公式
  • 费用要素是企业对各种费用按经济用途进行的分类
  • 工资福利支出包括五险一金吗
  • 补缴去年的工会经费计提
  • 公司哪些支出费用可以扣
  • 嵌入式软件开票税负是1%还是3%
  • 微信支付高速通行费怎么开电子发票
  • php二维数组的遍历
  • 前端种类
  • 投资收益如何记账
  • 已认证的发票
  • 成本不够用怎么办baixing
  • 帝国cms视频教程
  • 在建工程转入固定资产后又发生了后期支出会计处理
  • sql存储过程几个主要步骤
  • 钢管租赁如何跑业务
  • 新公司申请一般纳税人流程
  • 差旅费报销范围包括
  • 搬迁补偿款的会计分录
  • 汇算清缴前跨年调账怎么调
  • 企业将购进的原材料分录
  • 进项税额和销项税额有什么区别
  • 所得税需要转本吗
  • 建筑业预交税金会计分录
  • 处置存货损失应该放哪个科目
  • 工程款项目的发包人是谁
  • 代销货物收取手续费计入
  • 个体工商户可以变更法人吗
  • 公司买茶具帐务处理流程
  • 简述公司利润分配的程序
  • system表空间满了怎么处理
  • mysql获取日期年份
  • 对于微软用户来说,为了防止计算机意外故障
  • 在linux操作系统中
  • 配置结果
  • cmd命令 cd
  • mac系统怎么把文件移到文件夹
  • ocxdll.exe - ocxdll是什么进程 有什么用
  • excel中利用条件格式展示数据
  • ubuntu系统怎么安装
  • android真机调试解析包错误
  • bootstrap学习
  • 分享一些常用的文件
  • nodejs中使用HTTP分块响应和定时器示例代码
  • windows node.js
  • linux包含
  • windows的安装类型
  • python爬虫系统
  • javascript设计的初衷和特点
  • jQuery xml字符串的解析、读取及查找方法
  • 工具类软件有哪些
  • dom,ran
  • 实际金额与报关金额不符
  • 河南个人医保缴费查询
  • 广东税务待遇
  • 纳税人分类分级管理办法
  • 客运企业增值税税率是多少
  • 免责声明:网站部分图片文字素材来源于网络,如有侵权,请及时告知,我们会第一时间删除,谢谢! 邮箱:opceo@qq.com

    鄂ICP备2023003026号

    网站地图: 企业信息 工商信息 财税知识 网络常识 编程技术

    友情链接: 武汉网站建设