位置: IT常识 - 正文

YOLOv7改进之二十二:涨点神器——引入递归门控卷积(gnConv)(yolox改进)

编辑:rootadmin
YOLOv7改进之二十二:涨点神器——引入递归门控卷积(gnConv)

推荐整理分享YOLOv7改进之二十二:涨点神器——引入递归门控卷积(gnConv)(yolox改进),希望有所帮助,仅作参考,欢迎阅读内容。

文章相关热门搜索词:yolov2改进,yolov5能从哪些方面改进,yolov3 改进,yolov5 改进,yolov3改进算法,yolov3 改进,yolov5 改进,yolov3 改进,内容如对您有帮助,希望把文章链接给更多的朋友!

 ​前 言:作为当前先进的深度学习目标检测算法YOLOv7,已经集合了大量的trick,但是还是有提高和改进的空间,针对具体应用场景下的检测难点,可以不同的改进方法。此后的系列文章,将重点对YOLOv7的如何改进进行详细的介绍,目的是为了给那些搞科研的同学需要创新点或者搞工程项目的朋友需要达到更好的效果提供自己的微薄帮助和参考。由于出到YOLOv7,YOLOv5算法2020年至今已经涌现出大量改进论文,这个不论对于搞科研的同学或者已经工作的朋友来说,研究的价值和新颖度都不太够了,为与时俱进,以后改进算法以YOLOv7为基础,此前YOLOv5改进方法在YOLOv7同样适用,所以继续YOLOv5系列改进的序号。另外改进方法在YOLOv5等其他算法同样可以适用进行改进。希望能够对大家有帮助。

解决问题:YOLOv7主干特征提取网络为CNN网络,CNN具有平移不变性和局部性,缺乏全局建模长距离建模的能力,引入自然语言处理领域的框架Transformer来形成CNN+Transformer架构,充分两者的优点,提高目标检测效果,本人经过实验,对小目标以及密集预测任务会有一定的提升效果。视觉 Transformers 的最新进展在基于点积 self-attention 的新空间建模机制驱动的各种任务中取得了巨大成功。递归门控卷积(gnConv),它通过门控卷积和递归设计执行高阶空间交互。新操作具有高度的灵活性和可定制性,它兼容各种卷积变体,并将自注意力中的二阶交互扩​​展到任意阶,而不会引入大量额外的计算。gnConv 可以作为一个即插即用的模块来改进各种视觉 Transformer 和基于卷积的模型。Transformer方法融合参考YOLOv5改进往期。

YOLOv5改进之十七:CNN+Transformer——融合Bottleneck Transformers_人工智能算法研究院的博客-CSDN博客

原理:

YOLOv7改进之二十二:涨点神器——引入递归门控卷积(gnConv)(yolox改进)

论文:https://arxiv.org/pdf/2207.14284.pdf

代码:GitHub - raoyongming/HorNet: HorNet: Efficient High-Order Spatial Interactions with Recursive Gated Convolutions

视觉变形金刚的最新进展在各种任务中都取得了巨大的成功由基于点积自注意力的新空间建模机制驱动。在本文中,我们展示了愿景变形金刚背后的关键要素,即输入自适应、长程和高阶空间交互,也可以使用基于卷积的框架有效地实现。我们提出递归门控卷积(gnConv),它通过门控卷积和递归设计执行高阶空间交互。新的操作高度灵活可定制,兼容各种卷积变体并将 self-attention 中的二阶交互扩​​展到任意阶,而无需引入大量额外的计算。 GnConv 可以作为即插即用模块来改进各种视觉变压器和基于卷积的模型。基于该操作,我们构建了一个新的通用视觉骨干家族 命名为 HorNet。 ImageNet分类、COCO对象的大量实验检测和 ADE20K 语义分割显示 HorNet 优于 Swin Transformers 和 ConvNeXt 具有相似的整体架构和训练配置。 HorNet 还显示出良好的可扩展性更多的训练数据和更大的模型大小。除了视觉编码器的有效性之外,我们还展示了 gnConv 可以应用于特定任务的解码器和以更少的计算持续提高密集预测性能。我们的结果表明,gnConv 可以成为可视化建模的新基础模块它有效地结合了视觉 Transformer 和 CNN 的优点

 项目部分代码如下:

class gnconv(nn.Module): def __init__(self, dim, order=5, gflayer=None, h=14, w=8, s=1.0): super().__init__() self.order = order self.dims = [dim // 2 ** i for i in range(order)] self.dims.reverse() self.proj_in = nn.Conv2d(dim, 2*dim, 1) if gflayer is None: self.dwconv = get_dwconv(sum(self.dims), 7, True) else: self.dwconv = gflayer(sum(self.dims), h=h, w=w) self.proj_out = nn.Conv2d(dim, dim, 1) self.pws = nn.ModuleList( [nn.Conv2d(self.dims[i], self.dims[i+1], 1) for i in range(order-1)] ) self.scale = s print('[gnconv]', order, 'order with dims=', self.dims, 'scale=%.4f'%self.scale)

结 果:本人在多个数据集上做了大量实验,针对不同的数据集效果不同,涨点明显。

预告一下:下一篇内容将继续分享深度学习算法相关改进方法。有兴趣的朋友可以关注一下我,有问题可以留言或者私聊我哦

PS:卷积的替换不仅仅是适用改进YOLOv5,也可以改进其他的YOLO网络以及目标检测网络,比如YOLOv7、v6、v4、v3,Faster rcnn ,ssd等。

最后,希望能互粉一下,做个朋友,一起学习交流。

本文链接地址:https://www.jiuchutong.com/zhishi/297649.html 转载请保留说明!

上一篇:【实战与杂谈】如何复活一个开源网站-游戏王卡片生成器(实战到底究竟是什么意思啊)

下一篇:MySQL面试题-锁相关(数据库锁面试题)

  • 公司支付的房租押金怎么入账
  • 兼职人员怎么申报工资
  • 修缮服务开票项目一览表
  • 社保当月增员次月扣费
  • 营改增后小规模纳税人涉税账务处理
  • 扫微信送礼品是诈骗吗
  • 还有预算外资金的说法吗
  • 预收购货单位货款
  • 公司车无偿过户给个人需要什么手续
  • 长期股权投资收到红利会计处理
  • 发生工伤事故借条怎么写
  • 社会保险的登记和申报程序
  • 车辆购置税会计账务处理
  • 一次性发20万元个税如何算
  • 增值税的专用发票金额含税吗
  • 最新《资源税纳税标准
  • 承租方出售资产的行为
  • 企业所得税季报是填累计数吗
  • 装修费用如何做分录
  • 先收钱后开票怎么做分录
  • 商业汇票付款方通过哪个会计科目核算
  • 项目材料验收流程
  • 购买承兑汇票怎么做账
  • 文件的类型可以通过什么来区分
  • 房租租赁公司,对方还没付租金,怎么挂帐
  • 哪些收入要纳税
  • 高新技术企业研发人员比例要求
  • 公司卖二手车的流程
  • 汇款手续费应由谁承担
  • 若依官网
  • thinkphp ide
  • windows7旗舰版最新版本
  • PHP:finfo_file()的用法_fileinfo函数
  • vue3props用法
  • yii框架安装
  • redirect_uri参数错误的解决方法(必看)
  • java web购物系统
  • 租出固定资产的处理步骤
  • 财务负责人和法人哪个责任大
  • 商品出入库台账
  • 报销宽带费属于什么费用
  • 农机合作社项目申报方案
  • 公司缴纳残保金的标准
  • 应收分保合同准备材料
  • 稳岗补贴操作流程
  • 增值税专用发票几个点
  • 利息支出税前扣除时点
  • 装修费用会计科目
  • 法院拍卖土地原欠税怎么办
  • 以前年度房租付了没计提
  • 补发以前年度工资的账务处理
  • 补交上年度的企业所得税税款计入什么科目
  • 软件开发的知识产权有哪些
  • 企业发票冲红的风险
  • 开发成本六大类
  • 什么是企业合并的具体动因之一
  • 存货核算的含义
  • Linux/UNIX和Window平台上安装Mysql
  • sql server数据库中的null(空值)
  • mysql 300万条数据
  • rpm方式安装
  • linuxvlc安装
  • centos怎么修改文件权限
  • win7系统分辨率调错了黑屏
  • win10防火墙打不开错误代码
  • 在xp系统中设置u盘启动
  • win10升级100完成不动
  • win7系统怎么设置屏保图片
  • win10系统如何关闭
  • win8.1出现了一些问题
  • win10 edge浏览器怎样添加信任站点
  • win10按prtsc没反应
  • 64位Win7环境下vs2013配置opengl
  • Node.js中的全局变量有哪些
  • javascript可以写算法吗
  • 轻松搞定是什么短语
  • canvas的原理
  • unity3d 场景
  • 深圳如何打印个人参保证明
  • 处级工作调动用什么手续
  • 免责声明:网站部分图片文字素材来源于网络,如有侵权,请及时告知,我们会第一时间删除,谢谢! 邮箱:opceo@qq.com

    鄂ICP备2023003026号

    网站地图: 企业信息 工商信息 财税知识 网络常识 编程技术

    友情链接: 武汉网站建设