位置: IT常识 - 正文

DEFORMABLE DETR详解(deformable detr代码)

编辑:rootadmin
DEFORMABLE DETR详解 1.解决问题DETR需要比现有的目标检测器更长的训练时间来收敛。 DETR在检测小物体方面的性能相对较低,并且无法从高分辨率特征地图中检测到小物体。可变形卷积可以识别重要特征,但是无法学习重要特征之间的联系

推荐整理分享DEFORMABLE DETR详解(deformable detr代码),希望有所帮助,仅作参考,欢迎阅读内容。

文章相关热门搜索词:define format,deform详细教程,deformable convolution,deformable to rigid,deformable detr代码,define format,deformable to rigid,deformable detr代码,内容如对您有帮助,希望把文章链接给更多的朋友!

        transformer组件在处理图像特征图中的不足。在初始化时,注意模块对特征图中的所有像素施加了几乎一致的注意权重。长时间的训练周期是为了学习注意权重,以关注稀疏的有意义的位置。另一方面,transformer编码器中的注意权值计算是二次计算w.r.t.像素数。因此,处理高分辨率的特征映射具有非常高的计算和内存复杂性。

2.核心思想

        Deformable DETR,它的注意模块只关注一个目标周围的一小部分关键采样点。Deformable DETR可以获得比DETR(特别是在小物体上)更好的性能,在训练时间少10×的时期。 

3.实施细节

        可变形注意模块无论特征图的空间大小如何,都只关注参考点周围的一小组关键采样点(reference point)。通过为每个queries只分配少量固定数量的keys,可以缓解收敛性和特征空间分辨率的问题。 

        对于初始化,首先初始化采样附近的n个点(默认为4),即认为附近的点的特征对该点的关系最强,但是一定是吗?不一定,那么我们可以通过网络学习,偏移到关系最强的点。但是神经网络学习到的偏移不一定是小数,怎么办呢?那么我们就可以通过周围的点进行插值得到该点的特征。

 公式详解:

DEFORMABLE DETR详解(deformable detr代码)

         表示初始的采样的关键点,表示偏移量,表示特征的权重,即表示特征映射,

表示queries与keys的点乘,即注意力,其中和都是通过全连接而来。

        如下图所示, 表示特征图上的原始特征,经过全连接层做特征映射,同时采样出3个采样点。同时经过全连接层可得到注意力权重(qk)

  Multi-scale Deformable Attention Module. 

设为输入的多尺度特征映射(特征金字塔),其中。表示尺度信息,为每个queries的参考点的归一化坐标,即因为有多个尺度,需要将绝对坐标转为相对坐标,则应用多尺度可变形注意模块为

        外部的m表示多头注意力机制,L表示特征金字塔的维度,作者可能认为不同尺度同一位置的特征相似,因此,做相加操作。K表示采样的特征点

4.整体架构

         对于输入图片,首先经过Multi-scale Deformable self-Attention选取特征点,并做特征映射,生成向量,对于位置编码,有两种,一种是在相对位置编码加上绝对level级别编码,另外一种是加入可学习的level编码。然后输入decoder中,对于decoder,首先初始化300个初始化向量,经过self-Attention的处理,然后与ecoder特征做注意力运算,最后做预测。

 5.预测头的设置

        Iterative Bounding Box Refifinement. 建立了一种简单有效的迭代边界框细化机制,以提高检测性能。在这里,每个解码器层根据上一层的预测来细化边界框。        

        Two-Stage Deformable DETR. 在原始的DETR中,解码器中的对象查询与当前图像无关。受两阶段目标探测器的启发,我们探索了可变形DETR的一种变体,用于生成区域建议作为第一阶段。生成的区域建议将被输入解码器作为对象查询以进一步细化,形成一个两阶段可变形的DETR。         在第一阶段,为了实现高召回率的建议,多尺度特征图中的每个像素都将作为一个对象查询。然而,直接将对象查询设置为像素会给解码器中的自注意模块带来不可接受的计算和内存成本,其复杂度随着查询的数量呈二次增长。为了避免这个问题,我们去掉了解码器,并形成了一个仅限编码器的可变形的DETR,用于区域提案的生成。在它中,每个像素被分配为一个对象查询,它直接预测一个边界框。得分最高的边界框被选为区域提案。在将区域提案提交到第二阶段之前,不应用NMS。

本文链接地址:https://www.jiuchutong.com/zhishi/300391.html 转载请保留说明!

上一篇:Three.js一学就会系列:05 加载3D模型(three.js入门指南)

下一篇:【微信小程序】条件渲染和列表渲染(微信小程序开发)

  • iphone13pro怎么恢复出厂设置(iphone13pro怎么恢复删除的短信)

    iphone13pro怎么恢复出厂设置(iphone13pro怎么恢复删除的短信)

  • 花呗自动扣款在哪里关(花呗自动扣款在哪里设置的)

    花呗自动扣款在哪里关(花呗自动扣款在哪里设置的)

  • 荣耀畅玩20和畅玩20pro的区别(荣耀畅玩20和畅享20手机壳通用吗)

    荣耀畅玩20和畅玩20pro的区别(荣耀畅玩20和畅享20手机壳通用吗)

  • 12123网办进度在哪里查看(12123网办进度申请成功)

    12123网办进度在哪里查看(12123网办进度申请成功)

  • 微信视频对方是镜像吗(微信视频对方是反的)

    微信视频对方是镜像吗(微信视频对方是反的)

  • 亮度自动调节关闭了怎么还会自己打开(亮度自动调节关闭了怎么还会自动调节亮度oppo)

    亮度自动调节关闭了怎么还会自己打开(亮度自动调节关闭了怎么还会自动调节亮度oppo)

  • 兼容性检查器怎么回事(兼容性检查器怎么解决word)

    兼容性检查器怎么回事(兼容性检查器怎么解决word)

  • 抖音美化重置是什么意思(抖音里的美化设置完不管用怎么办)

    抖音美化重置是什么意思(抖音里的美化设置完不管用怎么办)

  • 京东订单取消退款要多久(京东订单取消退款了又收到货了)

    京东订单取消退款要多久(京东订单取消退款了又收到货了)

  • 晶体管时代是第几代(晶体管时代是第几代计算机)

    晶体管时代是第几代(晶体管时代是第几代计算机)

  • 转转永久封号怎么解决(转转永久封号怎么解除)

    转转永久封号怎么解决(转转永久封号怎么解除)

  • 爱奇艺没声音什么原因(爱奇艺没声音怎么回事)

    爱奇艺没声音什么原因(爱奇艺没声音怎么回事)

  • vivo快应用在哪(vivo快应用在哪个文件夹)

    vivo快应用在哪(vivo快应用在哪个文件夹)

  • 苹果11pro max没有手写功能吗(苹果11pro max没有5g吗)

    苹果11pro max没有手写功能吗(苹果11pro max没有5g吗)

  • 华为哪个手机是type-c(华为哪个手机是麒麟990)

    华为哪个手机是type-c(华为哪个手机是麒麟990)

  • wps查找快捷键是什么(wps表格查找快捷键)

    wps查找快捷键是什么(wps表格查找快捷键)

  • 苹果8可以反向充电吗(苹果8反向充电)

    苹果8可以反向充电吗(苹果8反向充电)

  • iphone11几寸(iphone11几寸屏幕)

    iphone11几寸(iphone11几寸屏幕)

  • word域代码在哪里(word域代码是什么意思)

    word域代码在哪里(word域代码是什么意思)

  • 微信数字证书是干嘛的(微信数字证书是自动开启的吗)

    微信数字证书是干嘛的(微信数字证书是自动开启的吗)

  • 分屏键盘怎么变小(分屏键盘怎么变小vivo)

    分屏键盘怎么变小(分屏键盘怎么变小vivo)

  • 美团众包拉黑怎么解封(美团众包拉黑名单了怎么办)

    美团众包拉黑怎么解封(美团众包拉黑名单了怎么办)

  • qq续草什么意思(女生说续草是什么意思)

    qq续草什么意思(女生说续草是什么意思)

  • vivox27第一次充电多长时间(vivo第一次充电需要把电用完吗)

    vivox27第一次充电多长时间(vivo第一次充电需要把电用完吗)

  • 苹果手机如何电话同步录音(苹果手机如何电视投屏设置方法)

    苹果手机如何电话同步录音(苹果手机如何电视投屏设置方法)

  • 高新企业享受税收优惠政策备案怎么申请
  • 销项税额是指
  • 边际贡献总额分析法的收入为零
  • 删除申报记录什么意思
  • 一般纳税人降为小规模还能升为一般纳税人吗
  • 怎么报企业所得税季报
  • 继续教育专项扣除金额
  • 成本收入不配比的风险有哪些
  • 长期股权投资审计说明
  • 注册资本余额为100万亿元
  • 前期物业开办费和承接费一样吗
  • 在建工程待摊支出例题
  • 服务类收入
  • 医院的重要性
  • 显示已申报税额
  • 普通发票需要做分录吗?
  • 增值是什么意思解释
  • 原材料质量问题退回
  • 缴纳车船税的车辆
  • 所得税汇算清缴截止日期
  • 少计收入被处罚账务处理怎么做?
  • 财务报告成本
  • 民间非营利组织会计制度会计科目
  • win11无法打开英雄联盟
  • 简易征收的分录
  • hpwuschd application
  • lnmgr.exe是什么
  • 2017年8月21日是什么日子
  • php文件扩展名是什么
  • 发票开错重新开票怎么做账务处理?
  • phpinfo页面
  • laravel执行seed命令
  • 应交增值税减免税额在借方
  • 实用的开源软件
  • NovelAi + Webui + Stable-diffusion本地配置
  • 蓝桥杯咋样
  • 毕业设计基于51单片机多功能电子钟的设计
  • 专项应付款借方余额表示
  • 贷款利息现金流量表什么项目
  • 以摊余成本计量的金融资产会计处理
  • 房地产预缴增值税计税依据
  • 医疗机构收据
  • 给客户维修设备更换配件怎么开票
  • 织梦如何使用
  • 在建工程项目的范围包括
  • 微信收款和支付宝收款有啥区别
  • datatable怎么用
  • access怎么提取数据
  • sql查询必须在什么的基础上创建
  • 物流公司交的保证金可以退吗?
  • 制造费用主要包括哪些内容
  • 进项税额和销项税额有什么区别
  • 车辆购置税计入什么科目
  • 公司向外借款给个人怎么做账
  • 进项税认证未抵扣怎么做账
  • 营改增后,小规模纳税人广联达
  • 企业取得土地使用权会计处理
  • 营改增后建筑业开票规定
  • 公司现金收入存入私人老板账户
  • 如何科学设置运动负荷
  • msde安装1秒不动了
  • mysql语句删除表
  • 向sql server数据库中导入
  • mysql删除的数据恢复
  • xp系统英文版怎么改成中文
  • windows server 2008的技巧:防止ping的方法
  • centos环境搭建
  • hipo.dll是什么
  • linux文件复制到windows
  • bootstrap表单模板
  • nodejs使用场景
  • cocos-2dx
  • javascript高级程序设计电子书
  • unity移动
  • dom教学
  • 基于mvc的项目实例
  • android数据存储总结
  • jquery插件库怎么导入
  • 小白学javascript
  • 医院缴纳什么税
  • 免责声明:网站部分图片文字素材来源于网络,如有侵权,请及时告知,我们会第一时间删除,谢谢! 邮箱:opceo@qq.com

    鄂ICP备2023003026号

    网站地图: 企业信息 工商信息 财税知识 网络常识 编程技术

    友情链接: 武汉网站建设