位置: IT常识 - 正文

注意力机制-CA注意力-Coordinate attention(注意力机制详解)

编辑:rootadmin
注意力机制-CA注意力-Coordinate attention 注意力机制学习--CA(Coordinate attention)简介CA注意力机制的优势:提出不足算法流程图代码最后简介

推荐整理分享注意力机制-CA注意力-Coordinate attention(注意力机制详解),希望有所帮助,仅作参考,欢迎阅读内容。

文章相关热门搜索词:注意力机制 cv,注意力机制 lstm,注意力机制 cv,注意力机制 cv,注意力机制 q k v,注意力机制 lstm,注意力机制cbam,注意力机制工作原理,内容如对您有帮助,希望把文章链接给更多的朋友!

CA(Coordinate attention for efficient mobile network design)发表在CVPR2021,帮助轻量级网络涨点、即插即用。

CA注意力机制的优势:注意力机制-CA注意力-Coordinate attention(注意力机制详解)

1、不仅考虑了通道信息,还考虑了方向相关的位置信息。 2、足够的灵活和轻量,能够简单的插入到轻量级网络的核心模块中。

提出不足

1、SE注意力中只关注构建通道之间的相互依赖关系,忽略了空间特征。 2、CBAM中引入了大尺度的卷积核提取空间特征,但忽略了长程依赖问题。

算法流程图

step1: 为了避免空间信息全部压缩到通道中,这里没有使用全局平均池化。为了能够捕获具有精准位置信息的远程空间交互,对全局平均池化进行的分解,具体如下: 对尺寸为C∗H∗WC*H*WC∗H∗W输入特征图InputInputInput分别按照XXX方向和YYY方向进行池化,分别生成尺寸为C∗H∗1C*H*1C∗H∗1和C∗1∗WC*1*WC∗1∗W的特征图。如下图所示(图片粘贴自B站大佬渣渣的熊猫潘)。 step2:将生成的C∗1∗WC*1*WC∗1∗W的特征图进行变换,然后进行concat操作。公式如下: 将zhz^hzh和zwz^wzw进行concat后生成如下图所示的特征图,然后进行F1操作(利用1*1卷积核进行降维,如SE注意力中操作)和激活操作,生成特征图f∈RC/r×(H+W)×1f \in \mathbb{R}^{C/r\times(H+W)\times1}f∈RC/r×(H+W)×1。 step3:沿着空间维度,再将fff进行split操作,分成fh∈RC/r×H×1f^h\in \mathbb{R}^{C/r\times H \times1}fh∈RC/r×H×1和fw∈RC/r×1×Wf^w\in \mathbb{R}^{C/r\times1\times W}fw∈RC/r×1×W,然后分别利用1×11 \times 11×1卷积进行升维度操作,再结合sigmoid激活函数得到最后的注意力向量gh∈RC×H×1g^h \in \mathbb{R}^{C \times H \times 1 }gh∈RC×H×1和gw∈RC×1×Wg^w\in \mathbb{R}^{C \times1\times W}gw∈RC×1×W。 最后:Coordinate Attention 的输出公式可以写成:

代码

代码粘贴自github。CoordAttention 地址:https://github.com/houqb/CoordAttention/blob/main/mbv2_ca.py

class CoordAtt(nn.Module): def __init__(self, inp, oup, groups=32): super(CoordAtt, self).__init__() self.pool_h = nn.AdaptiveAvgPool2d((None, 1)) self.pool_w = nn.AdaptiveAvgPool2d((1, None)) mip = max(8, inp // groups) self.conv1 = nn.Conv2d(inp, mip, kernel_size=1, stride=1, padding=0) self.bn1 = nn.BatchNorm2d(mip) self.conv2 = nn.Conv2d(mip, oup, kernel_size=1, stride=1, padding=0) self.conv3 = nn.Conv2d(mip, oup, kernel_size=1, stride=1, padding=0) self.relu = h_swish() def forward(self, x): identity = x n,c,h,w = x.size() x_h = self.pool_h(x) x_w = self.pool_w(x).permute(0, 1, 3, 2) y = torch.cat([x_h, x_w], dim=2) y = self.conv1(y) y = self.bn1(y) y = self.relu(y) x_h, x_w = torch.split(y, [h, w], dim=2) x_w = x_w.permute(0, 1, 3, 2) x_h = self.conv2(x_h).sigmoid() x_w = self.conv3(x_w).sigmoid() x_h = x_h.expand(-1, -1, h, w) x_w = x_w.expand(-1, -1, h, w) y = identity * x_w * x_h return y最后

CA不仅考虑到空间和通道之间的关系,还考虑到长程依赖问题。通过实验发现,CA不仅可以实现精度提升,且参数量、计算量较少。

简单进行记录,如有问题请大家指正。

本文链接地址:https://www.jiuchutong.com/zhishi/290832.html 转载请保留说明!

上一篇:el-table(type=“selection“)多选框两种回显

下一篇:鸟瞰皮纳图博火山湖和山脉,菲律宾波拉克 (© Amazing Aerial Agency/Offset by Shutterstock)(bestars皮纳)

  • 流量后时代:应用分发市场竞争激烈,用户质量比数量更重要(流量时代过去下一个时代是)

    流量后时代:应用分发市场竞争激烈,用户质量比数量更重要(流量时代过去下一个时代是)

  • 详细为新手解说网店推广方法(萌新解说视频)

    详细为新手解说网店推广方法(萌新解说视频)

  • 苹果13边框是什么材质(苹果13边框是什么形状)

    苹果13边框是什么材质(苹果13边框是什么形状)

  • 滴滴车主怎么设置屏幕常亮(滴滴车主怎么设置顺风车)

    滴滴车主怎么设置屏幕常亮(滴滴车主怎么设置顺风车)

  • 美图秀秀拼视频怎么没有原声音(美图秀秀拼视频为什么没有声音)

    美图秀秀拼视频怎么没有原声音(美图秀秀拼视频为什么没有声音)

  • 电脑怎么打大于号(电脑怎么打大于小于号)

    电脑怎么打大于号(电脑怎么打大于小于号)

  • 抖音如何让别人看不到我在线(抖音如何让别人看不到我的访客记录)

    抖音如何让别人看不到我在线(抖音如何让别人看不到我的访客记录)

  • 红外线设备怎么下载(红外线设备怎么连接)

    红外线设备怎么下载(红外线设备怎么连接)

  • 闲鱼曝光1万多算高吗(闲鱼曝光几万)

    闲鱼曝光1万多算高吗(闲鱼曝光几万)

  • 微信为什么没同意就进群了(微信为什么没同步信息)

    微信为什么没同意就进群了(微信为什么没同步信息)

  • 进程和程序的区别(进程和程序的区别有哪些)

    进程和程序的区别(进程和程序的区别有哪些)

  • 抖音为什么搜不到别人的抖音号(抖音为什么搜不到店铺定位)

    抖音为什么搜不到别人的抖音号(抖音为什么搜不到店铺定位)

  • k歌被对方拉黑了自己怎么解除(k歌被对方拉黑访问他主页他看的到吗?)

    k歌被对方拉黑了自己怎么解除(k歌被对方拉黑访问他主页他看的到吗?)

  • ipadair3弯曲的官方解释(ipadair3普遍弯曲)

    ipadair3弯曲的官方解释(ipadair3普遍弯曲)

  • 移动代理的关键技术有哪些(移动代理具有哪些功能?)

    移动代理的关键技术有哪些(移动代理具有哪些功能?)

  • 三张照片怎么合成一张(三张照片怎么合并)

    三张照片怎么合成一张(三张照片怎么合并)

  • blp661电池是什么型号(blp661电池是什么型号手机)

    blp661电池是什么型号(blp661电池是什么型号手机)

  • 如何查近期微信聊天的人(微信怎样可以查到前几天信息)

    如何查近期微信聊天的人(微信怎样可以查到前几天信息)

  • 腾讯视频自动续费第一个月可以取消吗(腾讯视频自动续费怎么取消苹果)

    腾讯视频自动续费第一个月可以取消吗(腾讯视频自动续费怎么取消苹果)

  • 快手怎么搜索视频(快手怎么搜索视频主人)

    快手怎么搜索视频(快手怎么搜索视频主人)

  • 红米note8pro怎么切换副卡上网(红米note8pro怎么插双卡)

    红米note8pro怎么切换副卡上网(红米note8pro怎么插双卡)

  • 华为荣耀怎么插耳机(华为荣耀怎么插卡视频)

    华为荣耀怎么插耳机(华为荣耀怎么插卡视频)

  • oppo手机左上角hd怎么取消(OPPO手机左上角黑圆圈咋回事)

    oppo手机左上角hd怎么取消(OPPO手机左上角黑圆圈咋回事)

  • 为什么安装不了抖音软件(为什么安装不了QQ)

    为什么安装不了抖音软件(为什么安装不了QQ)

  • 学习cad需要具备什么条件(cad需要学到什么程度)

    学习cad需要具备什么条件(cad需要学到什么程度)

  • 刷宝怎么发布视频(刷宝怎么发布视频赚钱)

    刷宝怎么发布视频(刷宝怎么发布视频赚钱)

  • 微软 Win11 22449.1000 版已将磁盘清理替换为新版“存储管理”(微软手机)

    微软 Win11 22449.1000 版已将磁盘清理替换为新版“存储管理”(微软手机)

  • 单目深度估计--深度学习篇(单目深度估计算法)

    单目深度估计--深度学习篇(单目深度估计算法)

  • 固定资产一次性折旧的账务处理和税务处理
  • 发票验旧以后还有用吗
  • 飞机票火车票汽车票抵扣进项税
  • 限定性资产账务处理
  • 投资收益做什么
  • 什么合同不需要做结算
  • 已付款收不到发票怎么办
  • 研发费用资本化支出
  • 固定资产未入固定资产账
  • 淘宝手续费是什么意思
  • 个体工商户的个人所得税如何申报
  • 工程物资和特种设备区别
  • 记账凭证的附件包括哪些
  • 个税申报包含哪些
  • 预付房租摊销账务处理
  • 房租发票上税的分录怎么写?
  • 客户预付货款会计分录
  • 公司增值税进项税不够还有什么办法处理
  • 原油资源税计税方法
  • 怎么看增值税专用发票是进项还是销项
  • 营改增后房地产开发税费一览表
  • 季度所得税报表季初资产总额怎么填
  • 法院拍卖破产企业房产,税费问题
  • 农民专业合作经济组织可以贷款吗
  • 制造费用分配的的标准是什么?
  • 银行授信额度如何分配
  • 个人所得税征收计算方法
  • 调整上年度多计提费用
  • 企业注销时资本公积怎么处理
  • 临时取得收入开具发票
  • 进口货物如何缴增值税
  • 超市开具预付卡发票不征税发票上税吗
  • 双cpu只有一个运行
  • 财政拨付专项资金进什么会计科目
  • 公司贷款过桥费合法吗
  • 苹果官网入口
  • linux获取操作命令的使用方法
  • PHP:Memcached::fetchAll()的用法_Memcached类
  • Win11 Build 22449.1000 预览版发布(附更新修复已知问题汇总)
  • isass是什么程序
  • 应收票据贴现的会计分录
  • 同城票据清算会怎么样
  • 手机短信是哪一年开始的
  • 工业企业采购部职责
  • 房地产企业开始退地的影响
  • yii2组件的理解
  • 新能源企业所得税税率是多少
  • php的laravel框架答辩
  • 公司员工个人所得税交多少
  • win10自带的重装能彻底清除上网记录和u盘记录吗
  • php访问路径
  • 可供出售债权投资
  • python 虚拟环境
  • 为什么没缴税
  • 进项税额转出会影响当期纳税吗?
  • php用户登录注册源码
  • mysql中用户和权限的作用
  • sql server 判断数据是否存在
  • 报销加油费怎么做账
  • sql批量替换日期中的月份
  • 工业设备种类
  • 残疾人保障金需要联系专管员吗
  • 我国居民企业判断标准
  • 装修费没发票怎么记账
  • 对公账户提取备用金怎么做账
  • 盈余公积的会计处理
  • 暂估应付账款余额在贷方
  • win8系统自带截图
  • CentOS里/etc/sysconfig/clock内容解读
  • secbizsrv.exe是什么程序
  • 怎么把html转换成psd
  • windows安装mq
  • cocos2dx框架
  • android怎么ping
  • unitysharder
  • 获取linux命令执行结果
  • unity克隆物体
  • 如何开具红字发票明细
  • 广州税务局前局长是谁
  • 融资租赁公司购入老旧租赁资产会计处理
  • 免责声明:网站部分图片文字素材来源于网络,如有侵权,请及时告知,我们会第一时间删除,谢谢! 邮箱:opceo@qq.com

    鄂ICP备2023003026号

    网站地图: 企业信息 工商信息 财税知识 网络常识 编程技术

    友情链接: 武汉网站建设