位置: IT常识 - 正文

RGB与Depth融合方法总结(rgb to hex)

编辑:rootadmin
RGB与Depth融合方法总结

推荐整理分享RGB与Depth融合方法总结(rgb to hex),希望有所帮助,仅作参考,欢迎阅读内容。

文章相关热门搜索词:rgbd和rgb的区别,rgb合成公式,rgb to hex,rgb合在一起是什么颜色,rgb混在一起,rgb合在一起是什么颜色,rgb合在一起是什么颜色,rgb to hex,内容如对您有帮助,希望把文章链接给更多的朋友!

RGB与Depth融合方法总结(rgb to hex)

1:在MMFNet中作者提出了几种传统的融合方法,(a)将RGB和Depth首先concat然后经过卷积最后生成特征图。(b)将RGB和Depth分别进行卷积,然后再add融合。(c)将RGB和Depth先进行卷积,经过transformation,再经过反卷积,融合起来。(d)RGB和Depth分别卷积,将depth融合再分别经过卷积,最后经过反卷积。这些经典的方法仍然有参考意义。

2:MMFNet的融合方法,其中RCU模块就像是SENet的雏形,不过当时还没有提出注意力机制。MRF模块就参考了上图中的b。

3:我自己试过的通过ASPP来对RGB和Depth进行特征提取,但是效果很不好。类似于这一种,分别对RGB和Depth进行PPM或者ASPP操作,然后进行拼接,最后经过1x1卷积,效果都不够好,可以说不如注意力机制。 4:出自Deep Surface Normal Estimation with Hierarchical RGB-D Fusion,是用来预测表面法线的,还没有看,先挖个坑。 5:接着就是注意力机制,包括SA-Gate,将RGB和Depth进行拼接,然后经过global pooling操作,得到1x1卷积再与本身相乘,然后再经过拼接,经过softmax得到一个权重,与原始图片进行相乘,两个注意力都用到了,他的点在于图像的去噪,将图像分离,去噪,融合,再分离,再融合。 6:在ESANet中应用了SENet中的Sequeeze-and-Excitation模块,将RGB和Depth分别进行 Sequeeze-and-Excitation,经过通道注意力,会学到应该关注于那些通道,相当于某些通道乘了一个大的权重,然后再与深度进行融合。 6:除了应用SENet中即插即用的模块,CANet还应用了非局部注意力来融合RGB和Depth。这个方法在DANet的创新点上进行创新。 DANet: CANet: CANet意图很清晰,通过RGB和Depth进行非局部注意力,得到的权重乘以Depth,然后和RGB进行融合,分别在空间上和通道上进行注意力融合,得到的结果再进行1x1卷积和纹理融合,可以说融合的很充分了。

随便揣测一下,这些操作都像是非局部注意力和深度可分离卷积的变形,非局部注意力,通过两个modality进行注意力得到的权重乘以原来的图片,深度可分离卷积,通过卷积核来聚合多个通道的信息,在经过1x1卷积来进行空间的遍历。

综上这是目前看到的RGB和Depth融合策略,以后看到了再补充。 -------------------------------------------------------补充----------------------------------------------------------------------------------------------------- 7:最近读了一篇CMX**,是nyu数据集上排名第一的方法,包含了深度与RGB融合方法: 其中FRM模块与SA-Gate的方法十分类似,都是通过进行特征图校准来去噪,CMX通过逐通道校准和逐空间校准,最后生成两个输出,SA-Gate则是通过通道的压缩和聚合来实现的,不过本质上也是注意力。 除此以外CMX还是用了Transformer来进行特征的交互和融合,最后再通过一个通道编码得到最终输出。 ----------------------------------------------------------------------补充----------------------------------------------------------------------------------- 8:最近读了一篇FRNet,作者受到SA-Gate的启发,提出了一种跨层跨模态的融合策略。主要使用这种top-down结构,通过将高层次语义信息和低层次特征信息进行融合。 ----------------------------------------------------------------------补充----------------------------------------------------------------------------------- 9:这是一篇2022最新的文章,Attention-based Dual Supervised Decoder for RGBD Semantic Segmentation,没有代码。和之前的融合方法有差别,但是差别不大。每一层融合之后不连接,融合方法就是注意力,创新点主要是后面的双分支decoder。在depth分支上采样到最后起到了监督的作用。 ---------------------------------------------------------------补充---------------------------------------------------------------------------------- 10:TransD-Fusion:transformer用于RGB-D融合来进行语义分割,在两个分支encoder的尾部进行融合。通过自注意力,交叉注意力,深度引导三步进行融合。在NYU上的miou达到了55.5。其中融合的部位和CANet一样,融合的方法在CMX也使用到了,交叉的transformer注意力。 11:在看TransD-Fusion文章的时候,他引用了一篇文章PGDENet: Progressive Guided Fusion and Depth Enhancement Network for RGB-D Indoor Scene Parsing也是RGB-D融合的,我就进去看了一下架构图,和之前的FRNet几乎一样,模型很像,就不仔细看了。 主要看一下PCFM模块和DEM模块: 12:RGB‑D Gate‑guided edge distillation for indoor semantic segmentation文章引入了边界引导,RGB和Depth分别处理,其中融合的结果作为一条单独的分支进行传递。在边界特征部分用到了原始GT进行边缘提取的边缘损失。

本文链接地址:https://www.jiuchutong.com/zhishi/297492.html 转载请保留说明!

上一篇:nvm介绍、安装、报错处理以及使用(nvm安装教程)

下一篇:一天撸一个财务APP系统【安卓端+前端+后端】

  • 增值税专用发票电子发票可以抵扣吗
  • 税务稽查最坏结果不知情人员怎么办
  • 假发票是怎么开出来的
  • 交车辆保险的车能买吗
  • 运输公司轮胎如何做会计分录
  • 某项目全部投资资金的40%由银行贷款
  • 增值税13%税率有哪些
  • 银行电子回单是原始凭证吗
  • 资本公积金转增股本是利好吗
  • 公司购买的二手车如何计提折旧
  • 应收账款融资的优缺点
  • 承包经营承包费增值税
  • 善意取得增值税专用发票如何处理
  • 因员工过失造成第三方损失
  • 公司股权平价转让要交税吗
  • 哪些费用可以计入待摊费用
  • 子公司注销欠母公司借款怎么办
  • 去年销售怎么算
  • 公司没有给员工买社保怎么赔偿
  • 个人所得税怎么查工资明细
  • 普票的销项可以抵扣吗?
  • 收到场地租赁费用计入什么科目
  • 正常工资薪金本期收入含哪些
  • 补交以前年度个税怎么做账
  • 罕见病药品进口要求
  • 该设备正在使用中怎么关闭u盘
  • 施工费增值税专用发票税率
  • 如何查企业是否上市公司
  • 11的文件管理在哪
  • 银承到期扣款会计分录
  • macOS 11 Big Sur 开发者预览版 Beta 7正式推送
  • 关联企业之间销售货物
  • 编制记账凭证出现错误
  • 所有者权益变动表范本
  • 单图像三维重建
  • 一般纳税人零申报怎么报税
  • 作为大学生你能为国家安全贡献哪些力量论文
  • js获取各种屏幕信息
  • Windows 10 python 3.9安装运行Mockingbird--拎包入住功略
  • 以小物件为话题写出背后的故事
  • 小规模纳税人申报表模板
  • pico实例
  • python输入三个数判断能否构成三角形
  • 残保金缴纳需要计提吗
  • 公司盖厂房没有票要交税吗?
  • mysql导出结果
  • 成本核算步骤
  • 同花顺电脑版怎么看财务报表
  • 小规模纳税人减免增值税会计处理
  • 包装的设计要遵循哪些要求?
  • 一次性开票分期收入账务处理
  • 企业存货明细表和盘点表
  • 股权转让的会计处理怎么做
  • 差旅费中住宿费的标准是什么
  • 费用发票可以不抵扣进项税吗
  • 企业收到待清算商户款项做什么分录
  • 固定资产如何分类?
  • sqlserver多表查询 索引
  • mac下安装python
  • windowsxp打开注册表
  • ubuntu终端终止正在执行的命令
  • centos6.5 minimal
  • windows怎么更改网络状态
  • pg环境变量
  • 游戏引擎有几种
  • cocos2dx-3.1.1 win8+eclipse+android开发 初学者容易迷惑的两个问题
  • Unity3D游戏开发标准教程吴亚峰于复兴人民邮电出版社
  • js内置对象方法有哪些
  • 无线adb调试开关下载
  • 网吧保存区连接怎么设置
  • css border-bottom
  • elementui基于vue
  • linux shell函数
  • cd跳转不到目录
  • node.js使用教程
  • linux常用命令及实例
  • js最简单的代码
  • h5实现微信分享
  • pycharm使用教程2022
  • 发票汇总表怎么计算
  • 免责声明:网站部分图片文字素材来源于网络,如有侵权,请及时告知,我们会第一时间删除,谢谢! 邮箱:opceo@qq.com

    鄂ICP备2023003026号

    网站地图: 企业信息 工商信息 财税知识 网络常识 编程技术

    友情链接: 武汉网站建设