位置: IT常识 - 正文

DEFORMABLE DETR详解(deformable detr代码)

编辑:rootadmin
DEFORMABLE DETR详解 1.解决问题DETR需要比现有的目标检测器更长的训练时间来收敛。 DETR在检测小物体方面的性能相对较低,并且无法从高分辨率特征地图中检测到小物体。可变形卷积可以识别重要特征,但是无法学习重要特征之间的联系

推荐整理分享DEFORMABLE DETR详解(deformable detr代码),希望有所帮助,仅作参考,欢迎阅读内容。

文章相关热门搜索词:define format,deform详细教程,deformable convolution,deformable to rigid,deformable detr代码,define format,deformable to rigid,deformable detr代码,内容如对您有帮助,希望把文章链接给更多的朋友!

        transformer组件在处理图像特征图中的不足。在初始化时,注意模块对特征图中的所有像素施加了几乎一致的注意权重。长时间的训练周期是为了学习注意权重,以关注稀疏的有意义的位置。另一方面,transformer编码器中的注意权值计算是二次计算w.r.t.像素数。因此,处理高分辨率的特征映射具有非常高的计算和内存复杂性。

2.核心思想

        Deformable DETR,它的注意模块只关注一个目标周围的一小部分关键采样点。Deformable DETR可以获得比DETR(特别是在小物体上)更好的性能,在训练时间少10×的时期。 

3.实施细节

        可变形注意模块无论特征图的空间大小如何,都只关注参考点周围的一小组关键采样点(reference point)。通过为每个queries只分配少量固定数量的keys,可以缓解收敛性和特征空间分辨率的问题。 

        对于初始化,首先初始化采样附近的n个点(默认为4),即认为附近的点的特征对该点的关系最强,但是一定是吗?不一定,那么我们可以通过网络学习,偏移到关系最强的点。但是神经网络学习到的偏移不一定是小数,怎么办呢?那么我们就可以通过周围的点进行插值得到该点的特征。

 公式详解:

DEFORMABLE DETR详解(deformable detr代码)

         表示初始的采样的关键点,表示偏移量,表示特征的权重,即表示特征映射,

表示queries与keys的点乘,即注意力,其中和都是通过全连接而来。

        如下图所示, 表示特征图上的原始特征,经过全连接层做特征映射,同时采样出3个采样点。同时经过全连接层可得到注意力权重(qk)

  Multi-scale Deformable Attention Module. 

设为输入的多尺度特征映射(特征金字塔),其中。表示尺度信息,为每个queries的参考点的归一化坐标,即因为有多个尺度,需要将绝对坐标转为相对坐标,则应用多尺度可变形注意模块为

        外部的m表示多头注意力机制,L表示特征金字塔的维度,作者可能认为不同尺度同一位置的特征相似,因此,做相加操作。K表示采样的特征点

4.整体架构

         对于输入图片,首先经过Multi-scale Deformable self-Attention选取特征点,并做特征映射,生成向量,对于位置编码,有两种,一种是在相对位置编码加上绝对level级别编码,另外一种是加入可学习的level编码。然后输入decoder中,对于decoder,首先初始化300个初始化向量,经过self-Attention的处理,然后与ecoder特征做注意力运算,最后做预测。

 5.预测头的设置

        Iterative Bounding Box Refifinement. 建立了一种简单有效的迭代边界框细化机制,以提高检测性能。在这里,每个解码器层根据上一层的预测来细化边界框。        

        Two-Stage Deformable DETR. 在原始的DETR中,解码器中的对象查询与当前图像无关。受两阶段目标探测器的启发,我们探索了可变形DETR的一种变体,用于生成区域建议作为第一阶段。生成的区域建议将被输入解码器作为对象查询以进一步细化,形成一个两阶段可变形的DETR。         在第一阶段,为了实现高召回率的建议,多尺度特征图中的每个像素都将作为一个对象查询。然而,直接将对象查询设置为像素会给解码器中的自注意模块带来不可接受的计算和内存成本,其复杂度随着查询的数量呈二次增长。为了避免这个问题,我们去掉了解码器,并形成了一个仅限编码器的可变形的DETR,用于区域提案的生成。在它中,每个像素被分配为一个对象查询,它直接预测一个边界框。得分最高的边界框被选为区域提案。在将区域提案提交到第二阶段之前,不应用NMS。

本文链接地址:https://www.jiuchutong.com/zhishi/300391.html 转载请保留说明!

上一篇:Three.js一学就会系列:05 加载3D模型(three.js入门指南)

下一篇:【微信小程序】条件渲染和列表渲染(微信小程序开发)

  • 先包装后销售先销售后包装的消费税处理
  • 赠送商品如何做账
  • 出口退税购入的商品进项税怎么处理
  • 个人抬头的发票可以报销吗
  • 发放遗属补助还要拍照片吗山东
  • 代订机票服务费可以抵扣进项吗
  • 实收资本资本公积盈余公积均属于投资者投入企业的资本
  • 多交的增值税怎么退
  • 投资款转为借款需要哪些证据
  • 未发货先开票怎么结转成本
  • 贸易公司发票怎么平衡
  • 跨年度销售退回所得税
  • 烟酒销售公司要交哪些税
  • 票据单据较多,费用报销单一张不够填怎么办?
  • 法人往公户转账需要备注吗
  • 美元结汇需要多长时间
  • 利息资本化的时点
  • 推广服务费收入如何核算成本
  • 合伙企业合伙人工资的账务处理
  • microsoft阻止应用启动
  • 怎么查看当前刷新率
  • 背书人账户名称填什么
  • Mac系统中使用QuickTime Player实现屏幕录像图文教程
  • 桌面鼠标右键菜单设置
  • 不动产增值税怎么算
  • 医院装修设计费一般多少钱一平方
  • php wechat
  • 银行承兑汇票的会计分录
  • 企业未实际出资
  • water gardens
  • 破产企业发放工资怎么算
  • 谈谈cookie的弊端
  • 办公室装修费怎么入账
  • 老生常谈含义
  • 存货跌价准备的转销会计分录
  • 无纸化办理
  • 员工报销的话费要缴纳个税吗?
  • 谷歌浏览器跨域解决方案
  • High-resolution image reconstruction with latent diffusion models from human brain activity
  • js原型模式创建对象的优缺点
  • 成本核算的五个要求
  • 企业收到发票冲销怎么办
  • 帝国cms栏目没有了
  • 资产负债表各项目的填列依据是
  • 结算备付金管理办法(2019年修订版)
  • 子公司认定消费税需要披露信息
  • 预收账款未发货会计分录
  • 企业所得税算法例题解析
  • 拍卖收入个人所得税
  • 年金缴费是什么意思
  • 销项税额专栏记录企业销售货物
  • 个税专项附加扣除标准调整
  • 如果企业长期股票怎么办
  • 金税三期个税申报
  • 一般纳税人购买原材料会计分录
  • 收款预缴增值税怎么做账
  • 持有至到期投资是债权投资吗
  • 存货损失营业外支出
  • 工伤事故补助或赔偿标准
  • 事业单位职工福利费支出范围
  • 小企业会计准则主要按照什么计量
  • 最新mysql数据库安装步骤
  • Win7 64位 mysql 5.7下载安装常见问题小结
  • win7系统锁屏密码
  • Win10 Mobile 10572预览版新增了哪些功能? 更新内容汇总
  • linux运维常用命令汇总
  • vim编辑器命令大全
  • win10周年版
  • linux groupmod命令参数及用法详解(linux修改组信息命令)
  • win7右下角小喇叭
  • win10周年版
  • win10更新已经下载好了能删除吗
  • JavaScript中数组长度的属性
  • 基于个人同意处理个人信息的个人什么撤回其同意
  • opengl glu
  • 车辆购置税是地方收入吗
  • 建筑工程施工企业资质
  • 财政部监制的发票
  • 个税申报表明细怎么打印
  • 税务系统领导干部监督管理办法
  • 免责声明:网站部分图片文字素材来源于网络,如有侵权,请及时告知,我们会第一时间删除,谢谢! 邮箱:opceo@qq.com

    鄂ICP备2023003026号

    网站地图: 企业信息 工商信息 财税知识 网络常识 编程技术

    友情链接: 武汉网站建设