位置: IT常识 - 正文

深度学习中的注意力机制模型及代码实现(SE Attention、CBAM Attention)

编辑:rootadmin
深度学习中的注意力机制模型及代码实现(SE Attention、CBAM Attention)

目录

常用的注意力机制模型

SE Attention

CBAM Attention

CBAM Attention 模型结构​

CBAM Attention 代码实现(Pytorch版):

 注意力机制加到网络的哪里合适


常用的注意力机制模型

推荐整理分享深度学习中的注意力机制模型及代码实现(SE Attention、CBAM Attention),希望有所帮助,仅作参考,欢迎阅读内容。

文章相关热门搜索词:,内容如对您有帮助,希望把文章链接给更多的朋友!

深度学习中的注意力机制模型及代码实现(SE Attention、CBAM Attention)

常用的注意力机制多为SE Attention和CBAM Attention。它们基本都可以当成一个简单的网络。例如SE注意力机制,它主要就是由两个全连接层组成,这就是一个简单的MLP模型,只是它的输出变了样。所以,在我们把注意力机制加入主干网络里时,所选注意力机制的复杂程度也是我们要考虑的一个方面,因为增加注意力机制,也变相的增加了我们网络的深度,大小。

SE Attention

详见这篇博文

经典网络模型-SENet注意力机制_L888666Q的博客-CSDN博客_senet网络模型

CBAM Attention

CBAM(Convolutional Block Attention Module) 表示卷积模块的注意力机制模块。是一种结合了空间(spatial)和通道(channel)的注意力机制模块。一般情况下,相比于SEnet只关注通道(channel)的注意力机制可以取得更好的效果。其中CBAM的结构如下面两张图,由Channel Attention和 Spatial Attention这两个模块组成,其中Channel Attention模块和SENet是十分相似的,只是在池化上做了最大和平均池化,把FC层换成了卷积。至于Spatial Attention模块,这个更为简单,本质上就是一个卷积层。论文地址

CBAM Attention 模型结构CBAM Attention 代码实现(Pytorch版):import numpy as npimport torchfrom torch import nnfrom torch.nn import initclass ChannelAttention(nn.Module): def __init__(self,channel,reduction=16): super().__init__() self.maxpool=nn.AdaptiveMaxPool2d(1) self.avgpool=nn.AdaptiveAvgPool2d(1) self.se=nn.Sequential( nn.Conv2d(channel,channel//reduction,1,bias=False), nn.ReLU(), nn.Conv2d(channel//reduction,channel,1,bias=False) ) self.sigmoid=nn.Sigmoid() def forward(self, x) : max_result=self.maxpool(x) avg_result=self.avgpool(x) max_out=self.se(max_result) avg_out=self.se(avg_result) output=self.sigmoid(max_out+avg_out) return outputclass SpatialAttention(nn.Module): def __init__(self,kernel_size=7): super().__init__() self.conv=nn.Conv2d(2,1,kernel_size=kernel_size,padding=kernel_size//2) self.sigmoid=nn.Sigmoid() def forward(self, x) : max_result,_=torch.max(x,dim=1,keepdim=True) avg_result=torch.mean(x,dim=1,keepdim=True) result=torch.cat([max_result,avg_result],1) output=self.conv(result) output=self.sigmoid(output) return outputclass CBAMBlock(nn.Module): def __init__(self, channel=512,reduction=16,kernel_size=49): super().__init__() self.ca=ChannelAttention(channel=channel,reduction=reduction) self.sa=SpatialAttention(kernel_size=kernel_size) def forward(self, x): b, c, _, _ = x.size() residual=x out=x*self.ca(x) out=out*self.sa(out) return out+residual 注意力机制加到网络的哪里合适

注意力机制是一个独立的块,一般来说加在哪里都是可以的,但是,注意机制加入我们的网络中时,他是会影响我们网络的特征提取的,即它注意的特征不一定都是我们重要的特征。所以注意力机制加入我们网络的位置就比较重要了。当我我们使用一个注意力机制不知道加在哪里时可以去看看提出注意力机制作者的源代码。如CBAM注意力机制的源代码,加在了残差网络(以resnet18为例)的残差块后面。如果我们使用的网络不是注意力机制作者使用的网络,建议加在最后一个卷积层后面或者第一个全连接层前面。当然并不是每个注意力机制或者每个网络都适用,因为不同的注意力机制注意的地方可能都不一样,所以加到主干网络的地方可能也不一样。  

本文链接地址:https://www.jiuchutong.com/zhishi/295880.html 转载请保留说明!

上一篇:VsCode安装yarn:yarn : 无法将“yarn”项识别为 cmdlet、函数、脚本文件或可运行程序的名(vscode安装python3)

下一篇:元宇宙、区块链 通俗易懂(元宇宙区块链数字货币)

  • 印花税应交税费
  • 运输公司的税率是多少
  • 实收资本的期末余额在借方还是贷方
  • 增值税申报表中应税货物销售额
  • 个税汇算清缴为啥要补交
  • 个税汇算清缴包括劳务报酬吗
  • 支票盖财务章盖在哪里
  • 委托付款税务认可吗
  • 航天金税盘证书口令错误
  • 税收抵免与税收的区别
  • 一次性预收租金增值税
  • 视同销售存货账务处理方法是什么?
  • 医药酒精现在要兑水喝吗
  • 滴滴出行客运服务费 事业单位 报销
  • 预提工程成本的会计分录
  • 公司对公账户可以转私人账户多久到账
  • 固定资产加速折旧最新政策2023
  • 客户付货款给我们公司备注往来结算款
  • 物业公司收的预存水费不够抵减怎么交税
  • 一般纳税人附加税费减免政策
  • 小企业财务报表不包括
  • 一人独资公司设立的条件
  • win7系统怎么进
  • wiwin11
  • 如何做预估成本
  • macos big sur怎么升级
  • PHP:xml_get_current_line_number()的用法_XML解析器函数
  • 上市公司股票如何套现
  • mac设置在哪里设置
  • 总分机构什么时候备案
  • 前期做了无票收入,后期怎么填写
  • 破产资产拍卖
  • 股票印花税和佣金的关系
  • php网站配置
  • 未交增值税的核算方法
  • 信用减值损失属于费用类科目吗
  • elementui的upload组件详解
  • rk3566 rk3288
  • element ui
  • springboot基本结构
  • 固定资产发票税率多少
  • 企业转让时应收账款如何处理
  • vue3父子组件通信
  • 什么时候过路费减半收费
  • 合伙人退伙后对退伙后的债务承担责任吗
  • 工程施工和工程结算的账务处理
  • 进口免税产品如何开票
  • 非公益捐赠如何入账
  • 母公司和子公司是两个完全独立的法人
  • 产品成本的具体内容
  • 公司是否可以投资股票
  • 当月已付款, 没收到发票怎么做账
  • 生产经营所得成本费用怎么算
  • 企业改制后如何管理
  • sqlserver 字符串包含
  • 几个常见的收敛级数
  • sqlserver的主数据库是什么
  • Centos7 下Mysql5.7.19安装教程详解
  • sql无法用sql身份验证
  • sql存储过程简单例题
  • 安装mysql提示one or more
  • 直接玩鬼泣4
  • 苹果mac怎样
  • win7 显示日期
  • linux系统怎么切换到命令行
  • Win8出现奇怪爆音的完美解决方法
  • synergy linux
  • android内存工具
  • jquery邮箱正则表达式
  • shell变量作用范围
  • python查找字符串中指定字符的个数
  • unity3d ui
  • jquery下拉列表
  • Jquery和BigFileUpload实现大文件上传及进度条显示
  • 零基础入门安卓逆向
  • 本年累计实际已预缴的所得税额怎么填
  • 光伏电站电力监控系统
  • 税控盘口令密码怎么修改
  • 融资租赁出租会计账务处理流程
  • 统一社会信用代码有什么用
  • 免责声明:网站部分图片文字素材来源于网络,如有侵权,请及时告知,我们会第一时间删除,谢谢! 邮箱:opceo@qq.com

    鄂ICP备2023003026号

    网站地图: 企业信息 工商信息 财税知识 网络常识 编程技术

    友情链接: 武汉网站建设