位置: IT常识 - 正文

YOLOv7改进之二十二:涨点神器——引入递归门控卷积(gnConv)(yolox改进)

编辑:rootadmin
YOLOv7改进之二十二:涨点神器——引入递归门控卷积(gnConv)

推荐整理分享YOLOv7改进之二十二:涨点神器——引入递归门控卷积(gnConv)(yolox改进),希望有所帮助,仅作参考,欢迎阅读内容。

文章相关热门搜索词:yolov2改进,yolov5能从哪些方面改进,yolov3 改进,yolov5 改进,yolov3改进算法,yolov3 改进,yolov5 改进,yolov3 改进,内容如对您有帮助,希望把文章链接给更多的朋友!

 ​前 言:作为当前先进的深度学习目标检测算法YOLOv7,已经集合了大量的trick,但是还是有提高和改进的空间,针对具体应用场景下的检测难点,可以不同的改进方法。此后的系列文章,将重点对YOLOv7的如何改进进行详细的介绍,目的是为了给那些搞科研的同学需要创新点或者搞工程项目的朋友需要达到更好的效果提供自己的微薄帮助和参考。由于出到YOLOv7,YOLOv5算法2020年至今已经涌现出大量改进论文,这个不论对于搞科研的同学或者已经工作的朋友来说,研究的价值和新颖度都不太够了,为与时俱进,以后改进算法以YOLOv7为基础,此前YOLOv5改进方法在YOLOv7同样适用,所以继续YOLOv5系列改进的序号。另外改进方法在YOLOv5等其他算法同样可以适用进行改进。希望能够对大家有帮助。

解决问题:YOLOv7主干特征提取网络为CNN网络,CNN具有平移不变性和局部性,缺乏全局建模长距离建模的能力,引入自然语言处理领域的框架Transformer来形成CNN+Transformer架构,充分两者的优点,提高目标检测效果,本人经过实验,对小目标以及密集预测任务会有一定的提升效果。视觉 Transformers 的最新进展在基于点积 self-attention 的新空间建模机制驱动的各种任务中取得了巨大成功。递归门控卷积(gnConv),它通过门控卷积和递归设计执行高阶空间交互。新操作具有高度的灵活性和可定制性,它兼容各种卷积变体,并将自注意力中的二阶交互扩​​展到任意阶,而不会引入大量额外的计算。gnConv 可以作为一个即插即用的模块来改进各种视觉 Transformer 和基于卷积的模型。Transformer方法融合参考YOLOv5改进往期。

YOLOv5改进之十七:CNN+Transformer——融合Bottleneck Transformers_人工智能算法研究院的博客-CSDN博客

原理:

YOLOv7改进之二十二:涨点神器——引入递归门控卷积(gnConv)(yolox改进)

论文:https://arxiv.org/pdf/2207.14284.pdf

代码:GitHub - raoyongming/HorNet: HorNet: Efficient High-Order Spatial Interactions with Recursive Gated Convolutions

视觉变形金刚的最新进展在各种任务中都取得了巨大的成功由基于点积自注意力的新空间建模机制驱动。在本文中,我们展示了愿景变形金刚背后的关键要素,即输入自适应、长程和高阶空间交互,也可以使用基于卷积的框架有效地实现。我们提出递归门控卷积(gnConv),它通过门控卷积和递归设计执行高阶空间交互。新的操作高度灵活可定制,兼容各种卷积变体并将 self-attention 中的二阶交互扩​​展到任意阶,而无需引入大量额外的计算。 GnConv 可以作为即插即用模块来改进各种视觉变压器和基于卷积的模型。基于该操作,我们构建了一个新的通用视觉骨干家族 命名为 HorNet。 ImageNet分类、COCO对象的大量实验检测和 ADE20K 语义分割显示 HorNet 优于 Swin Transformers 和 ConvNeXt 具有相似的整体架构和训练配置。 HorNet 还显示出良好的可扩展性更多的训练数据和更大的模型大小。除了视觉编码器的有效性之外,我们还展示了 gnConv 可以应用于特定任务的解码器和以更少的计算持续提高密集预测性能。我们的结果表明,gnConv 可以成为可视化建模的新基础模块它有效地结合了视觉 Transformer 和 CNN 的优点

 项目部分代码如下:

class gnconv(nn.Module): def __init__(self, dim, order=5, gflayer=None, h=14, w=8, s=1.0): super().__init__() self.order = order self.dims = [dim // 2 ** i for i in range(order)] self.dims.reverse() self.proj_in = nn.Conv2d(dim, 2*dim, 1) if gflayer is None: self.dwconv = get_dwconv(sum(self.dims), 7, True) else: self.dwconv = gflayer(sum(self.dims), h=h, w=w) self.proj_out = nn.Conv2d(dim, dim, 1) self.pws = nn.ModuleList( [nn.Conv2d(self.dims[i], self.dims[i+1], 1) for i in range(order-1)] ) self.scale = s print('[gnconv]', order, 'order with dims=', self.dims, 'scale=%.4f'%self.scale)

结 果:本人在多个数据集上做了大量实验,针对不同的数据集效果不同,涨点明显。

预告一下:下一篇内容将继续分享深度学习算法相关改进方法。有兴趣的朋友可以关注一下我,有问题可以留言或者私聊我哦

PS:卷积的替换不仅仅是适用改进YOLOv5,也可以改进其他的YOLO网络以及目标检测网络,比如YOLOv7、v6、v4、v3,Faster rcnn ,ssd等。

最后,希望能互粉一下,做个朋友,一起学习交流。

本文链接地址:https://www.jiuchutong.com/zhishi/297649.html 转载请保留说明!

上一篇:【实战与杂谈】如何复活一个开源网站-游戏王卡片生成器(实战到底究竟是什么意思啊)

下一篇:MySQL面试题-锁相关(数据库锁面试题)

  • 苹果可以换主题风格吗(苹果可以换主题和字体吗)

    苹果可以换主题风格吗(苹果可以换主题和字体吗)

  • 苹果11玩游戏没有声音怎么回事(苹果11玩游戏没有声音怎么设置)

    苹果11玩游戏没有声音怎么回事(苹果11玩游戏没有声音怎么设置)

  • 华为手机音量调到最大 还是太小怎么办(华为手机音量调到最小还是觉得大怎么办)

    华为手机音量调到最大 还是太小怎么办(华为手机音量调到最小还是觉得大怎么办)

  • 抖音公会退出被拒绝怎么办(抖音公会退出被拒绝可以注销吗)

    抖音公会退出被拒绝怎么办(抖音公会退出被拒绝可以注销吗)

  • 知乎邀请回答是随机的吗(知乎邀请回答是谁邀请的)

    知乎邀请回答是随机的吗(知乎邀请回答是谁邀请的)

  • 路由器通用吗(电信路由器和移动路由器通用吗)

    路由器通用吗(电信路由器和移动路由器通用吗)

  • 华为9plus怎么设置返回键(华为9plus怎么设置动态壁纸)

    华为9plus怎么设置返回键(华为9plus怎么设置动态壁纸)

  • 蓝牙耳机配对成功后只能用一个(蓝牙耳机配对成功后没有声音怎么办)

    蓝牙耳机配对成功后只能用一个(蓝牙耳机配对成功后没有声音怎么办)

  • 手机优化开不了机怎么回事(手机优化开不了机的原因)

    手机优化开不了机怎么回事(手机优化开不了机的原因)

  • 快门的主要作用是什么(快门的主要作用有哪两个方面)

    快门的主要作用是什么(快门的主要作用有哪两个方面)

  • 电脑开机显卡风扇不转是什么原因(电脑开机显卡风扇声音很大)

    电脑开机显卡风扇不转是什么原因(电脑开机显卡风扇声音很大)

  • 页面设置怎么设置(页面设置怎么设置成a4)

    页面设置怎么设置(页面设置怎么设置成a4)

  • 华为屏保时间怎么设置(华为屏保时间怎么移动位置)

    华为屏保时间怎么设置(华为屏保时间怎么移动位置)

  • 心形照片怎么拼(心形照片怎么拼图PPT)

    心形照片怎么拼(心形照片怎么拼图PPT)

  • 黑鲨手机怎么隐藏桌面图标(黑鲨手机怎么隐藏相册)

    黑鲨手机怎么隐藏桌面图标(黑鲨手机怎么隐藏相册)

  • 注销的qq号能恢复吗(注销的qq号可以恢复吗)

    注销的qq号能恢复吗(注销的qq号可以恢复吗)

  • 怎么入驻京东(怎么入驻京东集采)

    怎么入驻京东(怎么入驻京东集采)

  • 移动6位初始密码是多少(移动6位初始密码重置)

    移动6位初始密码是多少(移动6位初始密码重置)

  • PS基本的照片处理有哪些(ps图片的基本处理)

    PS基本的照片处理有哪些(ps图片的基本处理)

  • qq传输文件最大多少(qq传输文件最大支持多少)

    qq传输文件最大多少(qq传输文件最大支持多少)

  • 笔记本win10截图快捷键是什么?(笔记本windows10截屏)

    笔记本win10截图快捷键是什么?(笔记本windows10截屏)

  • PHP之ThinkPHP5路由的开启(thinkphp route)

    PHP之ThinkPHP5路由的开启(thinkphp route)

  • 个人所得税网上申报
  • 纳税人证明模板
  • 职工薪酬纳税调减的情况
  • 企业的书报费应计入销售费用
  • 办理税务登记需要法人身份证原件吗
  • 增值税附加税有没有滞纳金
  • 工会经费发放奖金需要代扣个税吗
  • 企业公示实缴填写
  • 固定资产一次扣除政策执行到什么时候?
  • 结转本月收入类账户到本年利润会计分录
  • 销售商品收入确认的五个条件
  • 服务业收到服务业发票分录
  • 开票金额大于收款金额如何处理
  • 股东投资款是否可以现金支付
  • 员工借款从工资扣除如何个税
  • 有限合伙企业收益分配
  • 跨年度冲减收入
  • 个体广告用去税务报账吗?
  • 个体户开票超了30万
  • 新政出台
  • 固定资产进项票能抵扣吗
  • 今年交上年税审核要多久
  • 2021年电子税务局印花税怎么申报
  • 购入材料未入库
  • 高新企业所得税税率10%
  • 工资薪金支出账载金额小于实际发生额
  • win11 zen2
  • 配置足够但玩游戏卡顿
  • uefi+bios
  • 市政府的财政拨款怎么算
  • 系统太多怎么办
  • 孕妇能吃桂圆吗有什么好处
  • 若依框架登录后跳转到指定页面
  • 前端实现拖拽拉动图片
  • php常用函数大全
  • linux获取操作命令的使用方法
  • PHP:preg_match_all()的用法_PCRE正则函数
  • 苹果电脑录屏带麦克风
  • 工程物资发生报废损毁
  • 公积金怎么做会计科目
  • vue上传文件和后端upload
  • web防盗链
  • bit/ttagapp
  • 浅析中国式现代化的理论价值与现实意义
  • 独立核算的分公司可以享受小微企业吗
  • Google C++ Style中允许使用的Boost库(1) 程序即人生 博客频道 CSDN.NET
  • 不得抵扣增值税的情形有哪些
  • 研发费用税前加计扣除金额怎么算
  • SQL Server 跨库同步数据
  • 原始凭证可以直接粘在记账凭证后吗
  • 会计核算方式有几种
  • 加计抵减的其他收益免税吗
  • 专项资金如何进行管理
  • 投资收益影响营业额吗
  • 其他收益会计科目解释
  • 营改增后计算土地增值税收入公式
  • 公司对员工的罚款用途
  • 递延收益是什么负债
  • 收客户逾期利息会计分录
  • 差旅费出差补助标准
  • 根据索引名称查字段
  • windows9预览版下载
  • centos7 本地yum
  • Win10 Redstone 11082视频快速上手:已知bug及新变化一览
  • cocos2dx游戏有哪些
  • linux中执行.sh文件
  • 常用的批处理命令
  • 用dos杀毒的一个软件
  • How to embed a jframe in an eclipse view
  • jquery 动态绑定
  • jquery动态设置css
  • python中while用法
  • nodejs实战
  • 网页编辑器手机版
  • android:Background线程池和UiThread线程池
  • jquery获取浏览器宽度
  • 小规模纳税人开3%专票怎么交税
  • 税务三方协议多久生效
  • 安置残疾人即征即退
  • 社保uk申请流程
  • 免责声明:网站部分图片文字素材来源于网络,如有侵权,请及时告知,我们会第一时间删除,谢谢! 邮箱:opceo@qq.com

    鄂ICP备2023003026号

    网站地图: 企业信息 工商信息 财税知识 网络常识 编程技术

    友情链接: 武汉网站建设