位置: IT常识 - 正文

YOLOv7改进之二十二:涨点神器——引入递归门控卷积(gnConv)(yolox改进)

编辑:rootadmin
YOLOv7改进之二十二:涨点神器——引入递归门控卷积(gnConv)

推荐整理分享YOLOv7改进之二十二:涨点神器——引入递归门控卷积(gnConv)(yolox改进),希望有所帮助,仅作参考,欢迎阅读内容。

文章相关热门搜索词:yolov2改进,yolov5能从哪些方面改进,yolov3 改进,yolov5 改进,yolov3改进算法,yolov3 改进,yolov5 改进,yolov3 改进,内容如对您有帮助,希望把文章链接给更多的朋友!

 ​前 言:作为当前先进的深度学习目标检测算法YOLOv7,已经集合了大量的trick,但是还是有提高和改进的空间,针对具体应用场景下的检测难点,可以不同的改进方法。此后的系列文章,将重点对YOLOv7的如何改进进行详细的介绍,目的是为了给那些搞科研的同学需要创新点或者搞工程项目的朋友需要达到更好的效果提供自己的微薄帮助和参考。由于出到YOLOv7,YOLOv5算法2020年至今已经涌现出大量改进论文,这个不论对于搞科研的同学或者已经工作的朋友来说,研究的价值和新颖度都不太够了,为与时俱进,以后改进算法以YOLOv7为基础,此前YOLOv5改进方法在YOLOv7同样适用,所以继续YOLOv5系列改进的序号。另外改进方法在YOLOv5等其他算法同样可以适用进行改进。希望能够对大家有帮助。

解决问题:YOLOv7主干特征提取网络为CNN网络,CNN具有平移不变性和局部性,缺乏全局建模长距离建模的能力,引入自然语言处理领域的框架Transformer来形成CNN+Transformer架构,充分两者的优点,提高目标检测效果,本人经过实验,对小目标以及密集预测任务会有一定的提升效果。视觉 Transformers 的最新进展在基于点积 self-attention 的新空间建模机制驱动的各种任务中取得了巨大成功。递归门控卷积(gnConv),它通过门控卷积和递归设计执行高阶空间交互。新操作具有高度的灵活性和可定制性,它兼容各种卷积变体,并将自注意力中的二阶交互扩​​展到任意阶,而不会引入大量额外的计算。gnConv 可以作为一个即插即用的模块来改进各种视觉 Transformer 和基于卷积的模型。Transformer方法融合参考YOLOv5改进往期。

YOLOv5改进之十七:CNN+Transformer——融合Bottleneck Transformers_人工智能算法研究院的博客-CSDN博客

原理:

YOLOv7改进之二十二:涨点神器——引入递归门控卷积(gnConv)(yolox改进)

论文:https://arxiv.org/pdf/2207.14284.pdf

代码:GitHub - raoyongming/HorNet: HorNet: Efficient High-Order Spatial Interactions with Recursive Gated Convolutions

视觉变形金刚的最新进展在各种任务中都取得了巨大的成功由基于点积自注意力的新空间建模机制驱动。在本文中,我们展示了愿景变形金刚背后的关键要素,即输入自适应、长程和高阶空间交互,也可以使用基于卷积的框架有效地实现。我们提出递归门控卷积(gnConv),它通过门控卷积和递归设计执行高阶空间交互。新的操作高度灵活可定制,兼容各种卷积变体并将 self-attention 中的二阶交互扩​​展到任意阶,而无需引入大量额外的计算。 GnConv 可以作为即插即用模块来改进各种视觉变压器和基于卷积的模型。基于该操作,我们构建了一个新的通用视觉骨干家族 命名为 HorNet。 ImageNet分类、COCO对象的大量实验检测和 ADE20K 语义分割显示 HorNet 优于 Swin Transformers 和 ConvNeXt 具有相似的整体架构和训练配置。 HorNet 还显示出良好的可扩展性更多的训练数据和更大的模型大小。除了视觉编码器的有效性之外,我们还展示了 gnConv 可以应用于特定任务的解码器和以更少的计算持续提高密集预测性能。我们的结果表明,gnConv 可以成为可视化建模的新基础模块它有效地结合了视觉 Transformer 和 CNN 的优点

 项目部分代码如下:

class gnconv(nn.Module): def __init__(self, dim, order=5, gflayer=None, h=14, w=8, s=1.0): super().__init__() self.order = order self.dims = [dim // 2 ** i for i in range(order)] self.dims.reverse() self.proj_in = nn.Conv2d(dim, 2*dim, 1) if gflayer is None: self.dwconv = get_dwconv(sum(self.dims), 7, True) else: self.dwconv = gflayer(sum(self.dims), h=h, w=w) self.proj_out = nn.Conv2d(dim, dim, 1) self.pws = nn.ModuleList( [nn.Conv2d(self.dims[i], self.dims[i+1], 1) for i in range(order-1)] ) self.scale = s print('[gnconv]', order, 'order with dims=', self.dims, 'scale=%.4f'%self.scale)

结 果:本人在多个数据集上做了大量实验,针对不同的数据集效果不同,涨点明显。

预告一下:下一篇内容将继续分享深度学习算法相关改进方法。有兴趣的朋友可以关注一下我,有问题可以留言或者私聊我哦

PS:卷积的替换不仅仅是适用改进YOLOv5,也可以改进其他的YOLO网络以及目标检测网络,比如YOLOv7、v6、v4、v3,Faster rcnn ,ssd等。

最后,希望能互粉一下,做个朋友,一起学习交流。

本文链接地址:https://www.jiuchutong.com/zhishi/297649.html 转载请保留说明!

上一篇:【实战与杂谈】如何复活一个开源网站-游戏王卡片生成器(实战到底究竟是什么意思啊)

下一篇:MySQL面试题-锁相关(数据库锁面试题)

  • 微信电脑版手机显示异地登录(微信电脑版手机打不开怎么回事)

    微信电脑版手机显示异地登录(微信电脑版手机打不开怎么回事)

  • 扁头耳机插上去没声音(扁头耳机插上去没反应怎么设置)

    扁头耳机插上去没声音(扁头耳机插上去没反应怎么设置)

  • cad遮罩命令快捷键(cad快速遮罩)

    cad遮罩命令快捷键(cad快速遮罩)

  • 微信登不进去能注销吗(微信登不进去能转账吗)

    微信登不进去能注销吗(微信登不进去能转账吗)

  • qq秘密朋友是啥意思(qq里秘密朋友的朋友是什么意思)

    qq秘密朋友是啥意思(qq里秘密朋友的朋友是什么意思)

  • 个性名片怎么取消(个性名片怎么设计)

    个性名片怎么取消(个性名片怎么设计)

  • 共享单车不锁会不会一直扣钱(共享单车不锁会扣多少钱)

    共享单车不锁会不会一直扣钱(共享单车不锁会扣多少钱)

  • 手机屏和机体摔分开了(手机屏和机体摔分开了用什么胶)

    手机屏和机体摔分开了(手机屏和机体摔分开了用什么胶)

  • 苹果手机充一晚电好吗(苹果手机充一晚上电可以吗)

    苹果手机充一晚电好吗(苹果手机充一晚上电可以吗)

  • win7连上无线网络但不能上网(win7连上无线网不能上网)

    win7连上无线网络但不能上网(win7连上无线网不能上网)

  • i5 7400配什么主板(i5 7400用什么显卡)

    i5 7400配什么主板(i5 7400用什么显卡)

  • vivo手机被锁定需要密码才能激活怎么办(vivo手机被锁定怎么强制激活)

    vivo手机被锁定需要密码才能激活怎么办(vivo手机被锁定怎么强制激活)

  • 电脑钉钉连麦对方听不到声音(电脑钉钉连麦对方听不到我的声音是什么原因?)

    电脑钉钉连麦对方听不到声音(电脑钉钉连麦对方听不到我的声音是什么原因?)

  • 有没有扫描文字的手机软件(有没有扫描文字转换成文字)

    有没有扫描文字的手机软件(有没有扫描文字转换成文字)

  • 抖音作品删了赞还在吗(抖音作品删了赞会少吗)

    抖音作品删了赞还在吗(抖音作品删了赞会少吗)

  • 电脑进入不了系统怎么办(电脑进入不了系统怎么办10)

    电脑进入不了系统怎么办(电脑进入不了系统怎么办10)

  • 韩剧tv的电影在哪里看(韩剧tv的电影在线观看)

    韩剧tv的电影在哪里看(韩剧tv的电影在线观看)

  • 三星c5应用分身在哪里(三星2018应用分身)

    三星c5应用分身在哪里(三星2018应用分身)

  • 美团怎么申请返现(美团怎么申请返现酒店)

    美团怎么申请返现(美团怎么申请返现酒店)

  • win10开机密码忘了(win10开机密码忘记了打不开怎么办)

    win10开机密码忘了(win10开机密码忘记了打不开怎么办)

  • kindle丢了可以追踪吗(kindle 丢了)

    kindle丢了可以追踪吗(kindle 丢了)

  • 累计百分比excel公式(累计百分比和百分比有什么区别)

    累计百分比excel公式(累计百分比和百分比有什么区别)

  • 苹果手机搜不到蓝牙设备解决方法(苹果手机搜不到airpods)

    苹果手机搜不到蓝牙设备解决方法(苹果手机搜不到airpods)

  • Web Spider Fiddler - JS Hook 基本使用

    Web Spider Fiddler - JS Hook 基本使用

  • PHP的几个常用加密函数(php添加)

    PHP的几个常用加密函数(php添加)

  • 劳务公司一般纳税人要交什么税
  • 各行业的税负率表2022
  • 进项税额比销项税额大怎么办
  • 如何区分追索权和付款请求权的区别
  • 发票开错对方已抵扣怎么处理
  • 承兑汇票区别
  • 实收资本变化的账务处理
  • 工程服务增值税税率1%
  • 政府非税收入的种类
  • 合并报表编制流程的准备工作
  • 代购货物的缴税情况
  • 外币借款汇兑差额计入什么科目
  • 利息收入可以作为业务招待费的基数吗
  • 坏账已核销
  • 交以前年度所得税怎么算
  • 待摊费用跨年冲销如何入账?
  • 不能抵扣的进项发票怎么做分录
  • 子公司向母公司借款对合并报表的影响
  • 收回的材料赔偿款怎么处理?
  • 委托代理合同后果的承担
  • 房屋租赁合同样本书
  • 营利性医院如何开办对外药房业务
  • 案例分析关于团员青年的思想困惑疏导和成长问题释疑
  • 开具发票时,哪些备注事项需要被重视?
  • 哪些票据可以冲销
  • 工会经费电子税务局找不见了
  • 公司资产重组流程
  • 事业单位事业收入和经营收入要上缴财政
  • 专项储备期末有余额吗
  • 物流补贴需要交税吗
  • windows11怎么设置壁纸
  • linux文本编辑器命令
  • 一般纳税人劳务发票税点多少
  • win7为什么这么多人用
  • 简单了解php编程软件
  • php 语法
  • php数组操作
  • 对公账户存款利息要交增值税吗
  • 男人喜欢什么样的女人最容易动心
  • 生产企业出口货物增值税如何申报
  • 最简单的上传php文件
  • 存货什么时候计提什么时候回转
  • 凯斯西储大学在哪个城市
  • elementui怎么样
  • yum命令安装软件
  • flash中文版
  • 信息技术服务所得税税负率多少
  • 报销差旅费用什么发票
  • 如何根据营业执照核定税种
  • 企业缴纳水利建设基金的依据是什么
  • 普通发票增量需要什么资料
  • 如何查看简易征信报告
  • mysql数据库介绍官方
  • access untagged
  • 成本票和进项票举例说明
  • 短期借款利息怎么做账
  • 土地使用权被政府收回要交个税吗
  • 陈列费计入什么科目
  • 国有资产无偿划转需要缴税吗
  • 建筑行业每月报税
  • 法院拍卖得来的物品有发票吗
  • 固定资产折旧的会计科目
  • 无形资产自行开发
  • 收到银联代收短信
  • 出口货物退货的原因
  • 公司的应付票据
  • Ubuntu下MySQL安装及配置远程登录教程
  • mysql报错1091
  • windows隐藏文件名
  • win7系统更改ip地址
  • unix命令大全
  • win10装360安全卫士
  • mac不小心把硬盘删了怎么办
  • Linux 修改文件名后缀
  • linux下scp远程拷贝包含空格的目录或者文件的解决方法
  • linux跨服务器调用shell脚本
  • python多线程代码
  • 河南商丘联通宽带最低多少钱
  • 山西电子税务局官网app
  • 新疆税务服务网
  • 免责声明:网站部分图片文字素材来源于网络,如有侵权,请及时告知,我们会第一时间删除,谢谢! 邮箱:opceo@qq.com

    鄂ICP备2023003026号

    网站地图: 企业信息 工商信息 财税知识 网络常识 编程技术

    友情链接: 武汉网站建设