位置: IT常识 - 正文

DEFORMABLE DETR详解(deformable detr代码)

编辑:rootadmin
DEFORMABLE DETR详解 1.解决问题DETR需要比现有的目标检测器更长的训练时间来收敛。 DETR在检测小物体方面的性能相对较低,并且无法从高分辨率特征地图中检测到小物体。可变形卷积可以识别重要特征,但是无法学习重要特征之间的联系

推荐整理分享DEFORMABLE DETR详解(deformable detr代码),希望有所帮助,仅作参考,欢迎阅读内容。

文章相关热门搜索词:define format,deform详细教程,deformable convolution,deformable to rigid,deformable detr代码,define format,deformable to rigid,deformable detr代码,内容如对您有帮助,希望把文章链接给更多的朋友!

        transformer组件在处理图像特征图中的不足。在初始化时,注意模块对特征图中的所有像素施加了几乎一致的注意权重。长时间的训练周期是为了学习注意权重,以关注稀疏的有意义的位置。另一方面,transformer编码器中的注意权值计算是二次计算w.r.t.像素数。因此,处理高分辨率的特征映射具有非常高的计算和内存复杂性。

2.核心思想

        Deformable DETR,它的注意模块只关注一个目标周围的一小部分关键采样点。Deformable DETR可以获得比DETR(特别是在小物体上)更好的性能,在训练时间少10×的时期。 

3.实施细节

        可变形注意模块无论特征图的空间大小如何,都只关注参考点周围的一小组关键采样点(reference point)。通过为每个queries只分配少量固定数量的keys,可以缓解收敛性和特征空间分辨率的问题。 

        对于初始化,首先初始化采样附近的n个点(默认为4),即认为附近的点的特征对该点的关系最强,但是一定是吗?不一定,那么我们可以通过网络学习,偏移到关系最强的点。但是神经网络学习到的偏移不一定是小数,怎么办呢?那么我们就可以通过周围的点进行插值得到该点的特征。

 公式详解:

DEFORMABLE DETR详解(deformable detr代码)

         表示初始的采样的关键点,表示偏移量,表示特征的权重,即表示特征映射,

表示queries与keys的点乘,即注意力,其中和都是通过全连接而来。

        如下图所示, 表示特征图上的原始特征,经过全连接层做特征映射,同时采样出3个采样点。同时经过全连接层可得到注意力权重(qk)

  Multi-scale Deformable Attention Module. 

设为输入的多尺度特征映射(特征金字塔),其中。表示尺度信息,为每个queries的参考点的归一化坐标,即因为有多个尺度,需要将绝对坐标转为相对坐标,则应用多尺度可变形注意模块为

        外部的m表示多头注意力机制,L表示特征金字塔的维度,作者可能认为不同尺度同一位置的特征相似,因此,做相加操作。K表示采样的特征点

4.整体架构

         对于输入图片,首先经过Multi-scale Deformable self-Attention选取特征点,并做特征映射,生成向量,对于位置编码,有两种,一种是在相对位置编码加上绝对level级别编码,另外一种是加入可学习的level编码。然后输入decoder中,对于decoder,首先初始化300个初始化向量,经过self-Attention的处理,然后与ecoder特征做注意力运算,最后做预测。

 5.预测头的设置

        Iterative Bounding Box Refifinement. 建立了一种简单有效的迭代边界框细化机制,以提高检测性能。在这里,每个解码器层根据上一层的预测来细化边界框。        

        Two-Stage Deformable DETR. 在原始的DETR中,解码器中的对象查询与当前图像无关。受两阶段目标探测器的启发,我们探索了可变形DETR的一种变体,用于生成区域建议作为第一阶段。生成的区域建议将被输入解码器作为对象查询以进一步细化,形成一个两阶段可变形的DETR。         在第一阶段,为了实现高召回率的建议,多尺度特征图中的每个像素都将作为一个对象查询。然而,直接将对象查询设置为像素会给解码器中的自注意模块带来不可接受的计算和内存成本,其复杂度随着查询的数量呈二次增长。为了避免这个问题,我们去掉了解码器,并形成了一个仅限编码器的可变形的DETR,用于区域提案的生成。在它中,每个像素被分配为一个对象查询,它直接预测一个边界框。得分最高的边界框被选为区域提案。在将区域提案提交到第二阶段之前,不应用NMS。

本文链接地址:https://www.jiuchutong.com/zhishi/300391.html 转载请保留说明!

上一篇:Three.js一学就会系列:05 加载3D模型(three.js入门指南)

下一篇:【微信小程序】条件渲染和列表渲染(微信小程序开发)

  • excel自动保存时间怎么设置(excel自动保存时间默认)

    excel自动保存时间怎么设置(excel自动保存时间默认)

  • 在WPS表格中,想要复制填充单元格怎么操作(在wps表格中想要快速格式化整个表格可以用什么功能)

    在WPS表格中,想要复制填充单元格怎么操作(在wps表格中想要快速格式化整个表格可以用什么功能)

  • 荣耀30s充满电会自动断电的吗(荣耀30s充满电会提示什么)

    荣耀30s充满电会自动断电的吗(荣耀30s充满电会提示什么)

  • 华为nova5EMUI9.1如何隐藏微信电话悬浮窗(华为nova5如何)

    华为nova5EMUI9.1如何隐藏微信电话悬浮窗(华为nova5如何)

  • 苹果手机wifi第二天自动开启(苹果手机的wifi)

    苹果手机wifi第二天自动开启(苹果手机的wifi)

  • 拼多多榜单标签是什么意思(拼多多榜单标签在哪里)

    拼多多榜单标签是什么意思(拼多多榜单标签在哪里)

  • 抖音app扣费是怎么回事(抖音扣费在哪里扣)

    抖音app扣费是怎么回事(抖音扣费在哪里扣)

  • qq音乐评论为什么显示不出来(qq音乐评论为什么会自动删除)

    qq音乐评论为什么显示不出来(qq音乐评论为什么会自动删除)

  • qq垃圾箱在哪里找(qq的垃圾箱在哪)

    qq垃圾箱在哪里找(qq的垃圾箱在哪)

  • beatsx摁电源没反应

    beatsx摁电源没反应

  • 苹果手机有没有分身功能(苹果手机有没有试卷还原功能)

    苹果手机有没有分身功能(苹果手机有没有试卷还原功能)

  • server和windows区别(windows server 和win10的区别)

    server和windows区别(windows server 和win10的区别)

  • ppt动画效果进入在哪(ppt动画效果进入棋盘下怎么设置)

    ppt动画效果进入在哪(ppt动画效果进入棋盘下怎么设置)

  • 小米移动4g什么意思(小米移动4g什么时候上市)

    小米移动4g什么意思(小米移动4g什么时候上市)

  • 手机主板坏了有什么症状(手机主板坏了有办法拿到资料吗)

    手机主板坏了有什么症状(手机主板坏了有办法拿到资料吗)

  • 手机中swf怎么打开(手机怎么用swf文件)

    手机中swf怎么打开(手机怎么用swf文件)

  • 乐视手机怎么全选联系人(乐视手机怎么全部删除)

    乐视手机怎么全选联系人(乐视手机怎么全部删除)

  • 应和的意思(附声应和的意思)

    应和的意思(附声应和的意思)

  • vue视频相机怎么添加音乐(vue怎么拍视频启动)

    vue视频相机怎么添加音乐(vue怎么拍视频启动)

  • wps空白处下划线怎么打(wps空白下划线不显示,必须有字)

    wps空白处下划线怎么打(wps空白下划线不显示,必须有字)

  • 爱奇艺怎么注销手机号(爱奇艺怎么注销qq账号)

    爱奇艺怎么注销手机号(爱奇艺怎么注销qq账号)

  • 苹果xs跟苹果11的区别(苹果xs跟苹果11参数对比)

    苹果xs跟苹果11的区别(苹果xs跟苹果11参数对比)

  • 6dzf12电池是什么意思(6dzf202电池是什么意思)

    6dzf12电池是什么意思(6dzf202电池是什么意思)

  • 网易考拉如何开店(网易考拉如何开小窗口)

    网易考拉如何开店(网易考拉如何开小窗口)

  • 电脑键盘快捷键自定义(电脑键盘快捷键怎么关)

    电脑键盘快捷键自定义(电脑键盘快捷键怎么关)

  • 手动设置IP时出现“已计划将多个默认网关用于提供单一网络”怎么办(手动设定ip地址后连不上网)

    手动设置IP时出现“已计划将多个默认网关用于提供单一网络”怎么办(手动设定ip地址后连不上网)

  • 销售无形资产增值税纳税义务发生时间
  • 小规模企业收入怎么做账
  • 去年的成本如何调整汇算清缴额
  • 税金及附加有啥
  • 事业单位取暖费什么时候发
  • 企业所得税跨期费用的相关规定
  • 小型企业缴纳企业所得税
  • 用白纸写的收据怎么入帐?
  • 应收账款收回时间怎么体现
  • 公司收到股东的投资款以后怎么处理
  • 园林绿化工程的分项工程有几个
  • 支付的租金计入什么会计科目
  • 增值税抵扣需要哪些附件
  • 购置税和购车税一样吗
  • 返利计提分录
  • 高新技术的研发收入是多少才可以提高
  • 出租方的维修义务
  • php数组函数输出《咏雪》里有多少"片"字
  • Win10 KB5004945 更新后多个品牌打印机无法使用的解决方法
  • WIN10怎么禁止始终处于活动状态
  • 清算期间会计科目
  • ValueError: all the input arrays must have same number of dimensions, but the array at index 0 has 1
  • 固定资产残料收税吗
  • php编程中的_横线表示什么
  • 最贵的苹果电脑99万
  • 【强化学习探索01】Win10 下gym安装
  • 准公益性企业
  • framework for
  • 存货跌价准备是负数表示什么
  • 前端工程搭建
  • ptech模型
  • cjzc框架
  • javascript数据类型分为哪两类
  • 企业合并兼并收购的区别和联系
  • 个人所得税大病医疗夫妻双方怎么扣除
  • 机器学习——果蔬分类
  • windows11/windows10专业清理的系统工具Duplicate Cleaner5.0.13中文破解免费下载
  • 独立核算的分公司注销时账面怎么处理
  • 中小企业暂估成本是多少
  • 工会经费计算表
  • 套期保值和套期图利
  • SQL server 2008安装程序遇到以下错误 sku
  • 公司自有房产出租给员工如何处理
  • 注册资本认缴到期
  • 如何降低应收账款成本
  • 期末账项调整的内容包括
  • 已收款未开票未发货能确认收入吗
  • 会计中借方和贷方各指什么
  • 全面推开营改增政策指引
  • 未分配利润核销不良贷款
  • 企业需要报哪些税
  • 电子发票一定要盖章吗
  • 给员工租的房子水电费谁出
  • 坏账准备计入营业外支出什么明细
  • 收到红字增值税发票哪里查
  • 什么情况下投资乘数最大
  • 个体工商户如何给员工交五险一金
  • 施工企业应收账款确认依据
  • sql server数据库文件的扩展名是
  • windowsxp网络ip设置
  • win10预览版退回正式版
  • xp系统新建用户后原来的用户没有了
  • 如何删除win7
  • c盘越来越小了
  • 怎么设置永久禁止下载拼多多
  • win10系统可以不用杀毒软件吗
  • Win10更新后浏览器不能联网怎么办
  • win7怎么禁止程序自启动
  • 个人简历
  • unity如何调整界面
  • Vuforia 4.0 beta——Object Recognition (一)
  • linux使用文本编辑器
  • Linux 中的 lo:0
  • jquery动态添加div
  • 重写runnable
  • checkbox选中一个其余选项置灰
  • js优化性能
  • 海关跟税务关系的区别
  • 中国税收居民申报
  • 免责声明:网站部分图片文字素材来源于网络,如有侵权,请及时告知,我们会第一时间删除,谢谢! 邮箱:opceo@qq.com

    鄂ICP备2023003026号

    网站地图: 企业信息 工商信息 财税知识 网络常识 编程技术

    友情链接: 武汉网站建设