位置: IT常识 - 正文

RGB与Depth融合方法总结(rgb to hex)

发布时间:2024-01-16
RGB与Depth融合方法总结

推荐整理分享RGB与Depth融合方法总结(rgb to hex),希望有所帮助,仅作参考,欢迎阅读内容。

文章相关热门搜索词:rgbd和rgb的区别,rgb合成公式,rgb to hex,rgb合在一起是什么颜色,rgb混在一起,rgb合在一起是什么颜色,rgb合在一起是什么颜色,rgb to hex,内容如对您有帮助,希望把文章链接给更多的朋友!

RGB与Depth融合方法总结(rgb to hex)

1:在MMFNet中作者提出了几种传统的融合方法,(a)将RGB和Depth首先concat然后经过卷积最后生成特征图。(b)将RGB和Depth分别进行卷积,然后再add融合。(c)将RGB和Depth先进行卷积,经过transformation,再经过反卷积,融合起来。(d)RGB和Depth分别卷积,将depth融合再分别经过卷积,最后经过反卷积。这些经典的方法仍然有参考意义。

2:MMFNet的融合方法,其中RCU模块就像是SENet的雏形,不过当时还没有提出注意力机制。MRF模块就参考了上图中的b。

3:我自己试过的通过ASPP来对RGB和Depth进行特征提取,但是效果很不好。类似于这一种,分别对RGB和Depth进行PPM或者ASPP操作,然后进行拼接,最后经过1x1卷积,效果都不够好,可以说不如注意力机制。 4:出自Deep Surface Normal Estimation with Hierarchical RGB-D Fusion,是用来预测表面法线的,还没有看,先挖个坑。 5:接着就是注意力机制,包括SA-Gate,将RGB和Depth进行拼接,然后经过global pooling操作,得到1x1卷积再与本身相乘,然后再经过拼接,经过softmax得到一个权重,与原始图片进行相乘,两个注意力都用到了,他的点在于图像的去噪,将图像分离,去噪,融合,再分离,再融合。 6:在ESANet中应用了SENet中的Sequeeze-and-Excitation模块,将RGB和Depth分别进行 Sequeeze-and-Excitation,经过通道注意力,会学到应该关注于那些通道,相当于某些通道乘了一个大的权重,然后再与深度进行融合。 6:除了应用SENet中即插即用的模块,CANet还应用了非局部注意力来融合RGB和Depth。这个方法在DANet的创新点上进行创新。 DANet: CANet: CANet意图很清晰,通过RGB和Depth进行非局部注意力,得到的权重乘以Depth,然后和RGB进行融合,分别在空间上和通道上进行注意力融合,得到的结果再进行1x1卷积和纹理融合,可以说融合的很充分了。

随便揣测一下,这些操作都像是非局部注意力和深度可分离卷积的变形,非局部注意力,通过两个modality进行注意力得到的权重乘以原来的图片,深度可分离卷积,通过卷积核来聚合多个通道的信息,在经过1x1卷积来进行空间的遍历。

综上这是目前看到的RGB和Depth融合策略,以后看到了再补充。 -------------------------------------------------------补充----------------------------------------------------------------------------------------------------- 7:最近读了一篇CMX**,是nyu数据集上排名第一的方法,包含了深度与RGB融合方法: 其中FRM模块与SA-Gate的方法十分类似,都是通过进行特征图校准来去噪,CMX通过逐通道校准和逐空间校准,最后生成两个输出,SA-Gate则是通过通道的压缩和聚合来实现的,不过本质上也是注意力。 除此以外CMX还是用了Transformer来进行特征的交互和融合,最后再通过一个通道编码得到最终输出。 ----------------------------------------------------------------------补充----------------------------------------------------------------------------------- 8:最近读了一篇FRNet,作者受到SA-Gate的启发,提出了一种跨层跨模态的融合策略。主要使用这种top-down结构,通过将高层次语义信息和低层次特征信息进行融合。 ----------------------------------------------------------------------补充----------------------------------------------------------------------------------- 9:这是一篇2022最新的文章,Attention-based Dual Supervised Decoder for RGBD Semantic Segmentation,没有代码。和之前的融合方法有差别,但是差别不大。每一层融合之后不连接,融合方法就是注意力,创新点主要是后面的双分支decoder。在depth分支上采样到最后起到了监督的作用。 ---------------------------------------------------------------补充---------------------------------------------------------------------------------- 10:TransD-Fusion:transformer用于RGB-D融合来进行语义分割,在两个分支encoder的尾部进行融合。通过自注意力,交叉注意力,深度引导三步进行融合。在NYU上的miou达到了55.5。其中融合的部位和CANet一样,融合的方法在CMX也使用到了,交叉的transformer注意力。 11:在看TransD-Fusion文章的时候,他引用了一篇文章PGDENet: Progressive Guided Fusion and Depth Enhancement Network for RGB-D Indoor Scene Parsing也是RGB-D融合的,我就进去看了一下架构图,和之前的FRNet几乎一样,模型很像,就不仔细看了。 主要看一下PCFM模块和DEM模块: 12:RGB‑D Gate‑guided edge distillation for indoor semantic segmentation文章引入了边界引导,RGB和Depth分别处理,其中融合的结果作为一条单独的分支进行传递。在边界特征部分用到了原始GT进行边缘提取的边缘损失。

本文链接地址:https://www.jiuchutong.com/zhishi/297492.html 转载请保留说明!

上一篇:nvm介绍、安装、报错处理以及使用(nvm安装教程)

下一篇:一天撸一个财务APP系统【安卓端+前端+后端】

  • 安卓手机如何打开.xmind文件(安卓手机如何打开zip文件)

    安卓手机如何打开.xmind文件(安卓手机如何打开zip文件)

  • 小米的无字模式在哪里(小米的无字模式是什么)

    小米的无字模式在哪里(小米的无字模式是什么)

  • oppo手机怎么搬家到苹果手机上(oppo手机怎么搬家到新手机上)

    oppo手机怎么搬家到苹果手机上(oppo手机怎么搬家到新手机上)

  • 小米10使用的处理器型号(小米10的使用体验)

    小米10使用的处理器型号(小米10的使用体验)

  • 钉钉摄像头上限是多少人(钉钉 摄像头)

    钉钉摄像头上限是多少人(钉钉 摄像头)

  • 秘乐短视频怎么注销账号(秘乐短视频怎么做任务)

    秘乐短视频怎么注销账号(秘乐短视频怎么做任务)

  • 魅族开发者选项不见了(魅族开发者选项怎么关闭)

    魅族开发者选项不见了(魅族开发者选项怎么关闭)

  • 导入库乐队的文件变灰(导入库乐队的文件变灰怎么删除)

    导入库乐队的文件变灰(导入库乐队的文件变灰怎么删除)

  • 拼多多月卡时间怎么计算(拼多多月卡时间是已开启算的吗)

    拼多多月卡时间怎么计算(拼多多月卡时间是已开启算的吗)

  • figure在matlab中是什么意思(figure在matlab中的作用)

    figure在matlab中是什么意思(figure在matlab中的作用)

  • 华为p40prohd怎么关闭(华为p40hdr怎么设置)

    华为p40prohd怎么关闭(华为p40hdr怎么设置)

  • 步步高与优学派的区别(步步高与优学派家教机的利与弊)

    步步高与优学派的区别(步步高与优学派家教机的利与弊)

  • nova6是双模5G吗 (nova6是双4g吗)

    nova6是双模5G吗 (nova6是双4g吗)

  • 华为怎么看电池寿命(华为怎么看电池容量)

    华为怎么看电池寿命(华为怎么看电池容量)

  • c语言中f是什么意思(c语言f是什么意思)

    c语言中f是什么意思(c语言f是什么意思)

  • 淘宝天天领红包在哪里(淘宝天天领红包在哪里才能找到)

    淘宝天天领红包在哪里(淘宝天天领红包在哪里才能找到)

  • 怎么看打印机终端编号(怎么看打印机终端的端口)

    怎么看打印机终端编号(怎么看打印机终端的端口)

  • 小米9有反向充电功能吗(小米9有反向充电吗)

    小米9有反向充电功能吗(小米9有反向充电吗)

  • 换手机号了探探登不上(手机号换了怎么上探探)

    换手机号了探探登不上(手机号换了怎么上探探)

  • 微云文件怎么发到微信(微云文件怎么发送到邮箱)

    微云文件怎么发到微信(微云文件怎么发送到邮箱)

  • ppt怎么循环自动播放(ppt怎么循环自动播放音乐)

    ppt怎么循环自动播放(ppt怎么循环自动播放音乐)

  • 苹果xs max有指纹锁吗(苹果xs max有指纹识别吗)

    苹果xs max有指纹锁吗(苹果xs max有指纹识别吗)

  • 打不通对方的电话是什么原因(打不通对方手机怎么办)

    打不通对方的电话是什么原因(打不通对方手机怎么办)

  • 饿了么如何退单(饿了么退订单怎么退)

    饿了么如何退单(饿了么退订单怎么退)

  • 如何增加手机空间(如何增加手机空间华为)

    如何增加手机空间(如何增加手机空间华为)

  • 纳税信用等级评定在哪里查询
  • 进项税额不允许抵扣怎么计算
  • 投标保证金保险怎么买
  • 开普票的销项税额
  • 资源要素包括哪三个方面
  • 个体工商户化妆品经营范围
  • 汽车道路救援费用多少
  • 无形资产土地需要折旧吗
  • 代开的专票开错了怎么办?
  • 个人所得税起征点什么时候调整的
  • 节日现金福利征收个人所得税吗
  • 费用报销审批单填写样本图片
  • 税务代开的专票未取票,逾期会作废吗?
  • 收据是否当月入帐
  • 出口视同内销补缴增值税会计分录?
  • 查账征收企业所得税季报怎么填
  • mac如何修改图片像素大小
  • 财务预提
  • 认缴资本 实收资本
  • 销售方怎么申请红字信息表
  • 常用的几种布局格式
  • imagestring php
  • vue绑定css样式
  • 企业所得税计算器在线计算
  • php引用文件的方法
  • php上传多文件
  • java开发和运维
  • php实现分页查询
  • 基于中国国情的中国式现代化具有哪些特色
  • sap abap入门
  • 未来社区政策支持
  • php access_token
  • php读取文件内容的方法和函数
  • 物业代收代缴费 没住户怎么办
  • 专票认证期限多长时间
  • 专项应付款二级明细科目有哪些
  • 什么情况印花税
  • 大额的维修费用怎么摊销
  • 豪华车消费税的计算公式
  • 物流破损拒收的理由
  • 销售折让怎么核算成本
  • 小规模季度必须报税吗
  • 进项税额加计扣除5%账务处理
  • vue实现响应式的原理
  • 税额和税款是一回事吗
  • 进口消费税为什么不是1乘2
  • 出租车发票可以改时间吗
  • 在计算应纳税所得额时
  • 小规模纳税人征税起点
  • 工程物资残料价值
  • 外币账户的钱怎么转成人民币
  • 贸易公司退税计算方法选哪一种
  • 转让专利权的使用权
  • 预收账款的金额是什么
  • 限售股包括哪些
  • 会计利润的计算公式是
  • 物流公司会计工作内容
  • 会计电算化建账的基本流程有哪些
  • 管理费怎么扣除
  • 怎么操作win10系统
  • win10系统即将过期怎么办
  • centos 安装程序
  • 和查看已连接的wifi密码
  • win7 管理
  • ubuntu20.04安装vnc
  • 内核版本能升级吗
  • linux 系统查看
  • win10下安装office2007
  • win8宽带错误651最简单解决方法
  • win8.1系统怎么激活
  • shell发送报文
  • js实现日历可获得的信息
  • node.js使用方法
  • nodejs lua
  • nodejs搭建网站
  • jquery中if语句
  • 江苏国家电子税务局网站
  • 税务总局绩效管理四大板块
  • 降低税率的坏处
  • 对方申请了红字信息表我这边怎么操作
  • 免责声明:网站部分图片文字素材来源于网络,如有侵权,请及时告知,我们会第一时间删除,谢谢! 邮箱:opceo@qq.com

    鄂ICP备2023003026号