位置: IT常识 - 正文

YOLOv7改进之二十二:涨点神器——引入递归门控卷积(gnConv)(yolox改进)

编辑:rootadmin
YOLOv7改进之二十二:涨点神器——引入递归门控卷积(gnConv)

推荐整理分享YOLOv7改进之二十二:涨点神器——引入递归门控卷积(gnConv)(yolox改进),希望有所帮助,仅作参考,欢迎阅读内容。

文章相关热门搜索词:yolov2改进,yolov5能从哪些方面改进,yolov3 改进,yolov5 改进,yolov3改进算法,yolov3 改进,yolov5 改进,yolov3 改进,内容如对您有帮助,希望把文章链接给更多的朋友!

 ​前 言:作为当前先进的深度学习目标检测算法YOLOv7,已经集合了大量的trick,但是还是有提高和改进的空间,针对具体应用场景下的检测难点,可以不同的改进方法。此后的系列文章,将重点对YOLOv7的如何改进进行详细的介绍,目的是为了给那些搞科研的同学需要创新点或者搞工程项目的朋友需要达到更好的效果提供自己的微薄帮助和参考。由于出到YOLOv7,YOLOv5算法2020年至今已经涌现出大量改进论文,这个不论对于搞科研的同学或者已经工作的朋友来说,研究的价值和新颖度都不太够了,为与时俱进,以后改进算法以YOLOv7为基础,此前YOLOv5改进方法在YOLOv7同样适用,所以继续YOLOv5系列改进的序号。另外改进方法在YOLOv5等其他算法同样可以适用进行改进。希望能够对大家有帮助。

解决问题:YOLOv7主干特征提取网络为CNN网络,CNN具有平移不变性和局部性,缺乏全局建模长距离建模的能力,引入自然语言处理领域的框架Transformer来形成CNN+Transformer架构,充分两者的优点,提高目标检测效果,本人经过实验,对小目标以及密集预测任务会有一定的提升效果。视觉 Transformers 的最新进展在基于点积 self-attention 的新空间建模机制驱动的各种任务中取得了巨大成功。递归门控卷积(gnConv),它通过门控卷积和递归设计执行高阶空间交互。新操作具有高度的灵活性和可定制性,它兼容各种卷积变体,并将自注意力中的二阶交互扩​​展到任意阶,而不会引入大量额外的计算。gnConv 可以作为一个即插即用的模块来改进各种视觉 Transformer 和基于卷积的模型。Transformer方法融合参考YOLOv5改进往期。

YOLOv5改进之十七:CNN+Transformer——融合Bottleneck Transformers_人工智能算法研究院的博客-CSDN博客

原理:

YOLOv7改进之二十二:涨点神器——引入递归门控卷积(gnConv)(yolox改进)

论文:https://arxiv.org/pdf/2207.14284.pdf

代码:GitHub - raoyongming/HorNet: HorNet: Efficient High-Order Spatial Interactions with Recursive Gated Convolutions

视觉变形金刚的最新进展在各种任务中都取得了巨大的成功由基于点积自注意力的新空间建模机制驱动。在本文中,我们展示了愿景变形金刚背后的关键要素,即输入自适应、长程和高阶空间交互,也可以使用基于卷积的框架有效地实现。我们提出递归门控卷积(gnConv),它通过门控卷积和递归设计执行高阶空间交互。新的操作高度灵活可定制,兼容各种卷积变体并将 self-attention 中的二阶交互扩​​展到任意阶,而无需引入大量额外的计算。 GnConv 可以作为即插即用模块来改进各种视觉变压器和基于卷积的模型。基于该操作,我们构建了一个新的通用视觉骨干家族 命名为 HorNet。 ImageNet分类、COCO对象的大量实验检测和 ADE20K 语义分割显示 HorNet 优于 Swin Transformers 和 ConvNeXt 具有相似的整体架构和训练配置。 HorNet 还显示出良好的可扩展性更多的训练数据和更大的模型大小。除了视觉编码器的有效性之外,我们还展示了 gnConv 可以应用于特定任务的解码器和以更少的计算持续提高密集预测性能。我们的结果表明,gnConv 可以成为可视化建模的新基础模块它有效地结合了视觉 Transformer 和 CNN 的优点

 项目部分代码如下:

class gnconv(nn.Module): def __init__(self, dim, order=5, gflayer=None, h=14, w=8, s=1.0): super().__init__() self.order = order self.dims = [dim // 2 ** i for i in range(order)] self.dims.reverse() self.proj_in = nn.Conv2d(dim, 2*dim, 1) if gflayer is None: self.dwconv = get_dwconv(sum(self.dims), 7, True) else: self.dwconv = gflayer(sum(self.dims), h=h, w=w) self.proj_out = nn.Conv2d(dim, dim, 1) self.pws = nn.ModuleList( [nn.Conv2d(self.dims[i], self.dims[i+1], 1) for i in range(order-1)] ) self.scale = s print('[gnconv]', order, 'order with dims=', self.dims, 'scale=%.4f'%self.scale)

结 果:本人在多个数据集上做了大量实验,针对不同的数据集效果不同,涨点明显。

预告一下:下一篇内容将继续分享深度学习算法相关改进方法。有兴趣的朋友可以关注一下我,有问题可以留言或者私聊我哦

PS:卷积的替换不仅仅是适用改进YOLOv5,也可以改进其他的YOLO网络以及目标检测网络,比如YOLOv7、v6、v4、v3,Faster rcnn ,ssd等。

最后,希望能互粉一下,做个朋友,一起学习交流。

本文链接地址:https://www.jiuchutong.com/zhishi/297649.html 转载请保留说明!

上一篇:【实战与杂谈】如何复活一个开源网站-游戏王卡片生成器(实战到底究竟是什么意思啊)

下一篇:MySQL面试题-锁相关(数据库锁面试题)

  • 苹果13promax重量(苹果13promax重量是多少)

    苹果13promax重量(苹果13promax重量是多少)

  • keep手环怎么调整时间(keep手环怎么调出二维码)

    keep手环怎么调整时间(keep手环怎么调出二维码)

  • 腾讯自动续费微信在哪里关闭(腾讯自动续费微信怎么关闭自动扣费)

    腾讯自动续费微信在哪里关闭(腾讯自动续费微信怎么关闭自动扣费)

  • 苹果可以更新13.4.1系统吗(苹果可以更新16.5吗)

    苹果可以更新13.4.1系统吗(苹果可以更新16.5吗)

  • 快手音量小怎么回事(快手音量小怎么设置)

    快手音量小怎么回事(快手音量小怎么设置)

  • 怎么跳过微信注册扫码(怎么跳过微信注册新账号)

    怎么跳过微信注册扫码(怎么跳过微信注册新账号)

  • i7和r7有什么区别在哪(i7和r7有什么区别哪个更好)

    i7和r7有什么区别在哪(i7和r7有什么区别哪个更好)

  • qq保护模式会自动解除吗(qq在保护模式)

    qq保护模式会自动解除吗(qq在保护模式)

  • 苹果13系统怎么降低版本(苹果13系统怎么样)

    苹果13系统怎么降低版本(苹果13系统怎么样)

  • 微信网络异常(微信网络异常封号怎么解封)

    微信网络异常(微信网络异常封号怎么解封)

  • 手机屏幕一角发黑(手机屏幕一角发蓝紫色)

    手机屏幕一角发黑(手机屏幕一角发蓝紫色)

  • 赞不了朋友圈封面是怎么回事(朋友圈赞不了封面是不是被删除了)

    赞不了朋友圈封面是怎么回事(朋友圈赞不了封面是不是被删除了)

  • 华为6nova6耳机孔在哪(华为nova65g耳机孔)

    华为6nova6耳机孔在哪(华为nova65g耳机孔)

  • imessage信息是什么

    imessage信息是什么

  • ipad可以打开pc端吗(ipad在电脑上打开)

    ipad可以打开pc端吗(ipad在电脑上打开)

  • 手机qq群文件怎么上传(手机qq群文件怎么转移到文件夹)

    手机qq群文件怎么上传(手机qq群文件怎么转移到文件夹)

  • 苹果x可以无线反向充电吗(苹果x可以无线快充吗)

    苹果x可以无线反向充电吗(苹果x可以无线快充吗)

  • 四个又念什么(四个又念什么三个又念什么)

    四个又念什么(四个又念什么三个又念什么)

  • oppoa9长宽多少厘米(oppoa9机身尺寸多少?)

    oppoa9长宽多少厘米(oppoa9机身尺寸多少?)

  • 苹果手机关机充电屏幕一直亮(苹果手机关机充了好久还无法开机)

    苹果手机关机充电屏幕一直亮(苹果手机关机充了好久还无法开机)

  • 小度需要一直插电吗(小度需要一直插着电源吗)

    小度需要一直插电吗(小度需要一直插着电源吗)

  • 怎样把电话号码移到新手机上(怎样把电话号码导入卡里)

    怎样把电话号码移到新手机上(怎样把电话号码导入卡里)

  • 三星手机数据怎么转移到内存卡(三星手机数据怎么导入苹果手机)

    三星手机数据怎么转移到内存卡(三星手机数据怎么导入苹果手机)

  • 三星手机怎么查真伪(三星手机怎么查使用时间)

    三星手机怎么查真伪(三星手机怎么查使用时间)

  • 开机时按f12键的作用(开机时按f12键的功能)

    开机时按f12键的作用(开机时按f12键的功能)

  • 安卓勿扰模式怎么取消(安卓勿扰模式怎么开)

    安卓勿扰模式怎么取消(安卓勿扰模式怎么开)

  • 关于个人取得的成果
  • 计税价格是什么税
  • 生产经营怎么填写
  • 个税返还款要交增值税吗
  • 兼职是属于劳动报酬吗
  • 总分机构是什么
  • 劳务公司临时工工资需要申报吗
  • 小规模可以开红网吗
  • 母公司及子公司借款要利息吗
  • 收到转账支票怎么去银行处理
  • 小规模免税农产品怎么做账
  • 未收回质保金是否需要交纳增值税呢?
  • 退回剩余的工程物资
  • 销售产品收取的价款
  • 一件商品若卖100元
  • 物流公司通行票抵税比例是多少
  • 喷绘广告公司税率是多少
  • 旅游景区税收标准
  • 何时进行文化事业建设
  • 新注册公司第一次怎么报税
  • 科研项目经费怎么填
  • 收到的支票背书怎么写
  • 收到往来款的账务处理
  • 小规模差旅费分录
  • 什么是增值税
  • 剑灵配置要求2020官方
  • 路由器2.4g和4g有什么区别
  • 计算机系统结构第三版课后答案
  • 一年以上预收账款
  • vue+cesium怎么实现地图的加载
  • 采购涉及哪些部门
  • 内部员工租房租金合法吗
  • 编制竣工决算的主要依据
  • 事业单位会计专业知识考什么
  • 青龙面板拉库命令
  • 实例讲解php设计软件
  • 带息应收票据会计处理
  • paul滑雪
  • php一个页面多个分页
  • vue3用法
  • 对供应商的罚款通知怎么写
  • 什么是稳岗补贴是给企业发放吗
  • 织梦cms怎么样
  • windows mongodb安装与配置
  • 股东借款作为项目投入的依据
  • 收到的存款利息
  • 中华人民共和国企业所得税年度纳税申报表
  • 利润计算公式是什么折扣
  • MySQL ERROR 2013 (HY000)错误解决方法
  • 税控服务费减免月底怎样结转
  • 个体工商户定期定额怎么报税
  • 小规模纳税人进项票可以抵扣吗
  • 机票改签手续费能报销吗
  • 未发货先开发票
  • 酒店营业额下降的原因
  • 新会计准则经营租赁
  • 公司账户可以转账到信用卡吗
  • 一个 sql 查询很慢,从哪些地方进行优化?
  • mysql怎么修改数据表
  • xp系统安装版如何安装
  • Linux驱动程序开发视频教程
  • Win7系统如何查看隐藏文件
  • win7怎么打开u盘里的的另一个U盘
  • js里写css
  • perl文件操作
  • jquery的css方法
  • javascript运用
  • 提取字符串的公式
  • javascript用处
  • android gradle task dependence
  • jquery导航菜单
  • 主机端口扫描程序设计python
  • jq cookie
  • android应用层是什么
  • 简单介绍中秋节
  • js控制浏览器返回按钮
  • python网络编程从入门到精通
  • 石油类资源税税率是多少
  • 贵州地税网上申报大厅
  • 南京国民政府统治和开辟革命新道路
  • 免责声明:网站部分图片文字素材来源于网络,如有侵权,请及时告知,我们会第一时间删除,谢谢! 邮箱:opceo@qq.com

    鄂ICP备2023003026号

    网站地图: 企业信息 工商信息 财税知识 网络常识 编程技术

    友情链接: 武汉网站建设