位置: IT常识 - 正文

DEFORMABLE DETR详解(deformable detr代码)

编辑:rootadmin
DEFORMABLE DETR详解 1.解决问题DETR需要比现有的目标检测器更长的训练时间来收敛。 DETR在检测小物体方面的性能相对较低,并且无法从高分辨率特征地图中检测到小物体。可变形卷积可以识别重要特征,但是无法学习重要特征之间的联系

推荐整理分享DEFORMABLE DETR详解(deformable detr代码),希望有所帮助,仅作参考,欢迎阅读内容。

文章相关热门搜索词:define format,deform详细教程,deformable convolution,deformable to rigid,deformable detr代码,define format,deformable to rigid,deformable detr代码,内容如对您有帮助,希望把文章链接给更多的朋友!

        transformer组件在处理图像特征图中的不足。在初始化时,注意模块对特征图中的所有像素施加了几乎一致的注意权重。长时间的训练周期是为了学习注意权重,以关注稀疏的有意义的位置。另一方面,transformer编码器中的注意权值计算是二次计算w.r.t.像素数。因此,处理高分辨率的特征映射具有非常高的计算和内存复杂性。

2.核心思想

        Deformable DETR,它的注意模块只关注一个目标周围的一小部分关键采样点。Deformable DETR可以获得比DETR(特别是在小物体上)更好的性能,在训练时间少10×的时期。 

3.实施细节

        可变形注意模块无论特征图的空间大小如何,都只关注参考点周围的一小组关键采样点(reference point)。通过为每个queries只分配少量固定数量的keys,可以缓解收敛性和特征空间分辨率的问题。 

        对于初始化,首先初始化采样附近的n个点(默认为4),即认为附近的点的特征对该点的关系最强,但是一定是吗?不一定,那么我们可以通过网络学习,偏移到关系最强的点。但是神经网络学习到的偏移不一定是小数,怎么办呢?那么我们就可以通过周围的点进行插值得到该点的特征。

 公式详解:

DEFORMABLE DETR详解(deformable detr代码)

         表示初始的采样的关键点,表示偏移量,表示特征的权重,即表示特征映射,

表示queries与keys的点乘,即注意力,其中和都是通过全连接而来。

        如下图所示, 表示特征图上的原始特征,经过全连接层做特征映射,同时采样出3个采样点。同时经过全连接层可得到注意力权重(qk)

  Multi-scale Deformable Attention Module. 

设为输入的多尺度特征映射(特征金字塔),其中。表示尺度信息,为每个queries的参考点的归一化坐标,即因为有多个尺度,需要将绝对坐标转为相对坐标,则应用多尺度可变形注意模块为

        外部的m表示多头注意力机制,L表示特征金字塔的维度,作者可能认为不同尺度同一位置的特征相似,因此,做相加操作。K表示采样的特征点

4.整体架构

         对于输入图片,首先经过Multi-scale Deformable self-Attention选取特征点,并做特征映射,生成向量,对于位置编码,有两种,一种是在相对位置编码加上绝对level级别编码,另外一种是加入可学习的level编码。然后输入decoder中,对于decoder,首先初始化300个初始化向量,经过self-Attention的处理,然后与ecoder特征做注意力运算,最后做预测。

 5.预测头的设置

        Iterative Bounding Box Refifinement. 建立了一种简单有效的迭代边界框细化机制,以提高检测性能。在这里,每个解码器层根据上一层的预测来细化边界框。        

        Two-Stage Deformable DETR. 在原始的DETR中,解码器中的对象查询与当前图像无关。受两阶段目标探测器的启发,我们探索了可变形DETR的一种变体,用于生成区域建议作为第一阶段。生成的区域建议将被输入解码器作为对象查询以进一步细化,形成一个两阶段可变形的DETR。         在第一阶段,为了实现高召回率的建议,多尺度特征图中的每个像素都将作为一个对象查询。然而,直接将对象查询设置为像素会给解码器中的自注意模块带来不可接受的计算和内存成本,其复杂度随着查询的数量呈二次增长。为了避免这个问题,我们去掉了解码器,并形成了一个仅限编码器的可变形的DETR,用于区域提案的生成。在它中,每个像素被分配为一个对象查询,它直接预测一个边界框。得分最高的边界框被选为区域提案。在将区域提案提交到第二阶段之前,不应用NMS。

本文链接地址:https://www.jiuchutong.com/zhishi/300391.html 转载请保留说明!

上一篇:Three.js一学就会系列:05 加载3D模型(three.js入门指南)

下一篇:【微信小程序】条件渲染和列表渲染(微信小程序开发)

  • 成人绘本适合人群与分类市场占比

    成人绘本适合人群与分类市场占比

  • oppo相机怎么调比例(oppo相机怎么调成九宫格)

    oppo相机怎么调比例(oppo相机怎么调成九宫格)

  • 导入库乐队的文件变灰(导入库乐队的文件变灰怎么删除)

    导入库乐队的文件变灰(导入库乐队的文件变灰怎么删除)

  • 微信哪个旧版本可以成功登录(微信哪个旧版本没有拍一拍)

    微信哪个旧版本可以成功登录(微信哪个旧版本没有拍一拍)

  • qcyt1左耳配对不上(qcyt1左耳连不上)

    qcyt1左耳配对不上(qcyt1左耳连不上)

  • 手机直播卡是什么原因(手机直播卡是什么问题)

    手机直播卡是什么原因(手机直播卡是什么问题)

  • 荣耀30 30s 区别(荣耀30和30s哪个性价比高)

    荣耀30 30s 区别(荣耀30和30s哪个性价比高)

  • 淘宝配送区域什么意思(淘宝配送到区域什么意思)

    淘宝配送区域什么意思(淘宝配送到区域什么意思)

  • 苹果自带软件可以删除吗(苹果自带软件可以下载吗)

    苹果自带软件可以删除吗(苹果自带软件可以下载吗)

  • 苹果手机边充电边玩为什么还是会掉电(苹果手机边充电边玩会爆炸吗)

    苹果手机边充电边玩为什么还是会掉电(苹果手机边充电边玩会爆炸吗)

  • 扫描仪分辨率越高越清晰吗(扫描仪的分辨率越高图像的清晰度越低)

    扫描仪分辨率越高越清晰吗(扫描仪的分辨率越高图像的清晰度越低)

  • 笔记本电源一拔就关机(笔记本电源一拔就黑屏了是什么原因)

    笔记本电源一拔就关机(笔记本电源一拔就黑屏了是什么原因)

  • 手机玩着玩着突然锁屏(手机玩着玩着突然黑屏是怎么回事)

    手机玩着玩着突然锁屏(手机玩着玩着突然黑屏是怎么回事)

  • gpu0和gpu1是什么意思(gpu0比gpu1高)

    gpu0和gpu1是什么意思(gpu0比gpu1高)

  • mi8lite是哪款手机(mi8lite手机多少钱)

    mi8lite是哪款手机(mi8lite手机多少钱)

  • iphone11pro怎么拍全景照片(11pro拍摄技巧)

    iphone11pro怎么拍全景照片(11pro拍摄技巧)

  • 本田的历史(本田车)

    本田的历史(本田车)

  • 韩剧tv电影在哪(韩剧tv有韩国电影吗)

    韩剧tv电影在哪(韩剧tv有韩国电影吗)

  • p30pro超级夜景怎么打开(p30pro夜景拍摄怎么调)

    p30pro超级夜景怎么打开(p30pro夜景拍摄怎么调)

  • 怎么改变网页字体粗细(怎么改网页的字)

    怎么改变网页字体粗细(怎么改网页的字)

  • 如何防止ppt格式乱掉(如何防止PPT格式不兼容)

    如何防止ppt格式乱掉(如何防止PPT格式不兼容)

  • 坦白说怎么发给陌生人(坦白说怎么发给好友)

    坦白说怎么发给陌生人(坦白说怎么发给好友)

  • word脚注怎么设置数字(word脚注怎么设置圆圈11)

    word脚注怎么设置数字(word脚注怎么设置圆圈11)

  • 微信如何解绑手机号(微信如何解绑手机号不绑定新的)

    微信如何解绑手机号(微信如何解绑手机号不绑定新的)

  • sesvc是什么启动项(sesvc是什么进程)

    sesvc是什么启动项(sesvc是什么进程)

  • Win11系统安装卡在"请稍等"的解决方法步骤(windows11安装后卡顿)

    Win11系统安装卡在"请稍等"的解决方法步骤(windows11安装后卡顿)

  • 微软 Win11 预览版已登陆 Azure 虚拟桌面:支持 TPM 2.0 和安全启动(微软win11预览版)

    微软 Win11 预览版已登陆 Azure 虚拟桌面:支持 TPM 2.0 和安全启动(微软win11预览版)

  • Vue3+TS教程(vue3+ts写法)

    Vue3+TS教程(vue3+ts写法)

  • 恶搞,vbs+bat实现随机位置无限弹窗(恶搞代码vbs教程)

    恶搞,vbs+bat实现随机位置无限弹窗(恶搞代码vbs教程)

  • 个体工商户应如何购买社会保险公积金
  • 核定征收可以不开免税普票吗
  • 生产企业的基础设施是指
  • 报关单上消费使用单位可以交税么
  • 转让土地使用权会计分录怎么做
  • 增值税进项销项每个月需要结转吗
  • 行政单位的财务报告包括财务报表和财务情况说明书
  • 建筑企业未开票收入增值税申报表怎么填写
  • 企业开发票的人员要经过培训吗?
  • 一般纳税人附加税减免
  • 公司租赁房屋的物业费怎么入账
  • 可以全额抵扣的发票
  • 利润表中利润归还投资
  • 预提厂房租金
  • 购入商品入库时发现实收物多余应收数计入什么科目
  • 公允价值上升是收益还是损失
  • 固定资产发票可以抵税吗
  • 自己开电子发票要什么软件
  • 海运费付款方式
  • 预提未收的租金怎么入账
  • 预收款项确认主营业务收入谨慎性
  • 企业增值税如何退税
  • 固态硬盘坏了的话是整个坏吗
  • 如何在excel中链接图片对方能显示
  • win 10动态锁是什么
  • 出租的厂房房产税谁交
  • 反射动态创建对象
  • 忘记电脑开机密码怎么打开电脑
  • 公司有长期挂账的权利吗
  • 保证金结息的会计分录
  • 福利企业即征即退优惠政策
  • 债务重组是什么工作
  • 资产增加为什么记借方
  • win10默认网关不可用总掉线解决方法
  • php的运算符主要包括哪些?
  • 政府机关出租房屋要交税吗
  • 定额发票怎么查询经营范围
  • html和css介绍
  • 水利建设基金按季度缴纳
  • vue自定义dialog
  • 阿里月薪3万到手多少
  • 面试题集锦
  • 芝麻信用app
  • 命令行修改mbr
  • cancel怎么关
  • 新准则公允价值变动科目余额为负数
  • 循环表是线性表吗
  • 公司月报和季报
  • 暂估入账后续处理
  • 现金折扣的账务处理最新
  • 经营性存款人罚款
  • 其他非流动资产是会计科目吗
  • 借贷记账法的记账依据是什么
  • 置换补贴算在优惠价里吗
  • 预缴增值税销售额是含税还是不含税的开票金额
  • 一般纳税人每月开票限额是多少
  • 外贸出口企业退税查不到进项发票
  • 初次申报出口退税可能会遇到哪些问题
  • 预收账款借贷方向增减
  • 生产经营收入总额填什么金额
  • 测绘费发票图片
  • 谁编写了元素周期表
  • 安装centos图形界面
  • win10无法安装telnet
  • macbook看视频卡顿
  • win7系统不能用了?
  • xp无法加载配置文件
  • window10如何设置访客权限
  • qt_5 not found
  • react-native-navigation
  • scrapy爬虫教程
  • 安卓手机wifi界面
  • 如何得到pull解析器?
  • 根据公司发展需求
  • android界面控件
  • Android-SQLite商业化数据库操作
  • unity-
  • 一种新的运算符号类型的题
  • jquery是怎样实现链式调用的?
  • 境外所得税额扣除的计算
  • 免责声明:网站部分图片文字素材来源于网络,如有侵权,请及时告知,我们会第一时间删除,谢谢! 邮箱:opceo@qq.com

    鄂ICP备2023003026号

    网站地图: 企业信息 工商信息 财税知识 网络常识 编程技术

    友情链接: 武汉网站建设