位置: IT常识 - 正文

注意力机制-CA注意力-Coordinate attention(注意力机制详解)

编辑:rootadmin
注意力机制-CA注意力-Coordinate attention 注意力机制学习--CA(Coordinate attention)简介CA注意力机制的优势:提出不足算法流程图代码最后简介

推荐整理分享注意力机制-CA注意力-Coordinate attention(注意力机制详解),希望有所帮助,仅作参考,欢迎阅读内容。

文章相关热门搜索词:注意力机制 cv,注意力机制 lstm,注意力机制 cv,注意力机制 cv,注意力机制 q k v,注意力机制 lstm,注意力机制cbam,注意力机制工作原理,内容如对您有帮助,希望把文章链接给更多的朋友!

CA(Coordinate attention for efficient mobile network design)发表在CVPR2021,帮助轻量级网络涨点、即插即用。

CA注意力机制的优势:注意力机制-CA注意力-Coordinate attention(注意力机制详解)

1、不仅考虑了通道信息,还考虑了方向相关的位置信息。 2、足够的灵活和轻量,能够简单的插入到轻量级网络的核心模块中。

提出不足

1、SE注意力中只关注构建通道之间的相互依赖关系,忽略了空间特征。 2、CBAM中引入了大尺度的卷积核提取空间特征,但忽略了长程依赖问题。

算法流程图

step1: 为了避免空间信息全部压缩到通道中,这里没有使用全局平均池化。为了能够捕获具有精准位置信息的远程空间交互,对全局平均池化进行的分解,具体如下: 对尺寸为C∗H∗WC*H*WC∗H∗W输入特征图InputInputInput分别按照XXX方向和YYY方向进行池化,分别生成尺寸为C∗H∗1C*H*1C∗H∗1和C∗1∗WC*1*WC∗1∗W的特征图。如下图所示(图片粘贴自B站大佬渣渣的熊猫潘)。 step2:将生成的C∗1∗WC*1*WC∗1∗W的特征图进行变换,然后进行concat操作。公式如下: 将zhz^hzh和zwz^wzw进行concat后生成如下图所示的特征图,然后进行F1操作(利用1*1卷积核进行降维,如SE注意力中操作)和激活操作,生成特征图f∈RC/r×(H+W)×1f \in \mathbb{R}^{C/r\times(H+W)\times1}f∈RC/r×(H+W)×1。 step3:沿着空间维度,再将fff进行split操作,分成fh∈RC/r×H×1f^h\in \mathbb{R}^{C/r\times H \times1}fh∈RC/r×H×1和fw∈RC/r×1×Wf^w\in \mathbb{R}^{C/r\times1\times W}fw∈RC/r×1×W,然后分别利用1×11 \times 11×1卷积进行升维度操作,再结合sigmoid激活函数得到最后的注意力向量gh∈RC×H×1g^h \in \mathbb{R}^{C \times H \times 1 }gh∈RC×H×1和gw∈RC×1×Wg^w\in \mathbb{R}^{C \times1\times W}gw∈RC×1×W。 最后:Coordinate Attention 的输出公式可以写成:

代码

代码粘贴自github。CoordAttention 地址:https://github.com/houqb/CoordAttention/blob/main/mbv2_ca.py

class CoordAtt(nn.Module): def __init__(self, inp, oup, groups=32): super(CoordAtt, self).__init__() self.pool_h = nn.AdaptiveAvgPool2d((None, 1)) self.pool_w = nn.AdaptiveAvgPool2d((1, None)) mip = max(8, inp // groups) self.conv1 = nn.Conv2d(inp, mip, kernel_size=1, stride=1, padding=0) self.bn1 = nn.BatchNorm2d(mip) self.conv2 = nn.Conv2d(mip, oup, kernel_size=1, stride=1, padding=0) self.conv3 = nn.Conv2d(mip, oup, kernel_size=1, stride=1, padding=0) self.relu = h_swish() def forward(self, x): identity = x n,c,h,w = x.size() x_h = self.pool_h(x) x_w = self.pool_w(x).permute(0, 1, 3, 2) y = torch.cat([x_h, x_w], dim=2) y = self.conv1(y) y = self.bn1(y) y = self.relu(y) x_h, x_w = torch.split(y, [h, w], dim=2) x_w = x_w.permute(0, 1, 3, 2) x_h = self.conv2(x_h).sigmoid() x_w = self.conv3(x_w).sigmoid() x_h = x_h.expand(-1, -1, h, w) x_w = x_w.expand(-1, -1, h, w) y = identity * x_w * x_h return y最后

CA不仅考虑到空间和通道之间的关系,还考虑到长程依赖问题。通过实验发现,CA不仅可以实现精度提升,且参数量、计算量较少。

简单进行记录,如有问题请大家指正。

本文链接地址:https://www.jiuchutong.com/zhishi/290832.html 转载请保留说明!

上一篇:el-table(type=“selection“)多选框两种回显

下一篇:鸟瞰皮纳图博火山湖和山脉,菲律宾波拉克 (© Amazing Aerial Agency/Offset by Shutterstock)(bestars皮纳)

  • 腾讯视频怎么邀请好友一起观看(腾讯视频怎么邀请)

    腾讯视频怎么邀请好友一起观看(腾讯视频怎么邀请)

  • iphone13pro忘记锁屏密码(iphone13忘记解锁密码怎么办)

    iphone13pro忘记锁屏密码(iphone13忘记解锁密码怎么办)

  • 微信怎么查社保交了多少年(微信怎么查社保缴费记录明细步骤)

    微信怎么查社保交了多少年(微信怎么查社保缴费记录明细步骤)

  • 怎么解除抖音绑定的手机号(怎么解除抖音绑的银行卡绑定)

    怎么解除抖音绑定的手机号(怎么解除抖音绑的银行卡绑定)

  • qq被盗怎么找回(qq被盗怎么找回来)

    qq被盗怎么找回(qq被盗怎么找回来)

  • 微信收不了别人的转账(微信收不了别人红包怎么解除)

    微信收不了别人的转账(微信收不了别人红包怎么解除)

  • 三星a60听筒声音小(三星a60听筒声音很小)

    三星a60听筒声音小(三星a60听筒声音很小)

  • 2605d硒鼓清零(联想lj2605d硒鼓灯亮)

    2605d硒鼓清零(联想lj2605d硒鼓灯亮)

  • 拼多多账号异常怎么解除(拼多多账号异常再重新注册一个会正常吗)

    拼多多账号异常怎么解除(拼多多账号异常再重新注册一个会正常吗)

  • 蚂蚁森林的弹幕别人可以看见吗(蚂蚁森林的弹幕多久有效)

    蚂蚁森林的弹幕别人可以看见吗(蚂蚁森林的弹幕多久有效)

  • 如何解除花呗预授权(花呗预支付是什么意思)

    如何解除花呗预授权(花呗预支付是什么意思)

  • ipad第七代电池容量(ipad第七代电池健康)

    ipad第七代电池容量(ipad第七代电池健康)

  • 网易云音乐怎么把歌词弄到屏幕上(网易云音乐怎么关闭会员自动续费)

    网易云音乐怎么把歌词弄到屏幕上(网易云音乐怎么关闭会员自动续费)

  • word2016怎么删除页眉横线(word2016怎么删除某一页的页码)

    word2016怎么删除页眉横线(word2016怎么删除某一页的页码)

  • 微信是什么时候开始正式使用的(微信是什么时候出来的软件啊)

    微信是什么时候开始正式使用的(微信是什么时候出来的软件啊)

  • 手机没有通话记录怎么回事(手机没有通话记录怎么恢复正常)

    手机没有通话记录怎么回事(手机没有通话记录怎么恢复正常)

  • Reno Ace怎么恢复微信聊天记录(oppo ace如何恢复出厂设置)

    Reno Ace怎么恢复微信聊天记录(oppo ace如何恢复出厂设置)

  • 京东退货运费谁承担(京东退货运费谁承担还没到货)

    京东退货运费谁承担(京东退货运费谁承担还没到货)

  • 三星充电口检测到水汽(三星充电口检测到潮湿)

    三星充电口检测到水汽(三星充电口检测到潮湿)

  • 小度在家可以投屏吗(小度在家可以投影吗)

    小度在家可以投屏吗(小度在家可以投影吗)

  • el-cascader 动态加载选项、编辑时数据回显问题 、单选不加载下一级节点、点击标签选中(el-cascader动态加载多级)

    el-cascader 动态加载选项、编辑时数据回显问题 、单选不加载下一级节点、点击标签选中(el-cascader动态加载多级)

  • 汇算清缴期间费用填表说明
  • 待抵扣进项税的账务处理
  • 纳税调整增加额在报表的哪里
  • 房租雇东不开发票只有收据怎么处理?
  • 个税里的累计专票是什么
  • 银行承兑汇票手续费是多少
  • 旧房转让土地增值税扣除项目
  • 记账凭证摘要的重要性
  • 对方公司倒闭应收账款发票还需要开吗
  • 销项负数发票用勾选吗
  • 买空调交税是谁交税
  • 租赁厂房发生的改造装修费用
  • 物业公司代收电费标准
  • 四季度企业所得税怎么报
  • 企业税前扣除凭证包括以下哪些方面
  • 288000元大写怎么写
  • 勾选认证的发票在哪里能查询
  • 收到捐赠的固定资产需要折旧吗
  • 非营利组织免税收入孳生的银行存款利息
  • 出纳人员怎么进入会计
  • mac app store一直转圈圈
  • 一般纳税人进项税额转出会计分录
  • 给员工购买的意外保险可以税前扣除
  • 无线网连上却上不了网络
  • 待抵扣进项税额是二级还是三级
  • 附加税是按照应交增值税还是已交
  • 怎样调整以前年度多计的收入
  • edge浏览器总是打开新的网页
  • falogincn修改无线密码
  • php字符串定义
  • 非货币性资产交换的记忆口诀
  • session.php
  • 出售固定资产申报表收入与损益表收入不一致
  • PHP:mcrypt_ofb()的用法_Mcrypt函数
  • 长期待摊费用与预付账款的区别
  • 企业资产负债表有何作用
  • 生产型企业出口退税计算案例
  • the模板引擎
  • js中...的用法
  • vue-element
  • php curl_exec
  • 小规模免征增值税2023
  • 从业人数啥意思
  • 企业合并的定义是什么
  • 房产税按照租金
  • 自有资金等于货币资金吗
  • 高新技术企业认定中介机构
  • 进项税大于销项税怎么抵扣
  • 当月未开票收入八百万
  • 外经证适用范围
  • 销售边角料的增值税率
  • 应扣未扣税款对纳税人的处理
  • 股权转让,受让方的会计分录
  • 对公账户进出账常识
  • 物料损耗率计算例题及答案
  • 新注册企业实收资本没到账怎么处理
  • 短期借款利息计提分录怎么写
  • 小规模公司开票税率是多少
  • 公司的钱如何提出来
  • 本年利润借方余额需要结转吗
  • 什么是资产减值转回
  • 税控盘减免税款需要结转吗
  • sql复合语句
  • window系统怎么用
  • wlltweak.exe
  • win7本地磁盘图标变了
  • grep的结果 再次查找
  • 常用的linux系统版本有哪些
  • windows8.1crazy error
  • 每日十条简短新闻
  • 怎样从零开始
  • CCProgressTimer 进度条动画在cocos2dx+lua中的使用
  • 批处理 修改文件名
  • Linux 中的cat命令
  • 搭建nodejs项目
  • 音频基础知识及训练
  • python代码规范化
  • 动物大联盟是国内品牌吗
  • 动员讲话简短精辟
  • 广东省电子税务局app下载官网
  • 免责声明:网站部分图片文字素材来源于网络,如有侵权,请及时告知,我们会第一时间删除,谢谢! 邮箱:opceo@qq.com

    鄂ICP备2023003026号

    网站地图: 企业信息 工商信息 财税知识 网络常识 编程技术

    友情链接: 武汉网站建设