位置: IT常识 - 正文

RGB与Depth融合方法总结(rgb to hex)

编辑:rootadmin
RGB与Depth融合方法总结

推荐整理分享RGB与Depth融合方法总结(rgb to hex),希望有所帮助,仅作参考,欢迎阅读内容。

文章相关热门搜索词:rgbd和rgb的区别,rgb合成公式,rgb to hex,rgb合在一起是什么颜色,rgb混在一起,rgb合在一起是什么颜色,rgb合在一起是什么颜色,rgb to hex,内容如对您有帮助,希望把文章链接给更多的朋友!

RGB与Depth融合方法总结(rgb to hex)

1:在MMFNet中作者提出了几种传统的融合方法,(a)将RGB和Depth首先concat然后经过卷积最后生成特征图。(b)将RGB和Depth分别进行卷积,然后再add融合。(c)将RGB和Depth先进行卷积,经过transformation,再经过反卷积,融合起来。(d)RGB和Depth分别卷积,将depth融合再分别经过卷积,最后经过反卷积。这些经典的方法仍然有参考意义。

2:MMFNet的融合方法,其中RCU模块就像是SENet的雏形,不过当时还没有提出注意力机制。MRF模块就参考了上图中的b。

3:我自己试过的通过ASPP来对RGB和Depth进行特征提取,但是效果很不好。类似于这一种,分别对RGB和Depth进行PPM或者ASPP操作,然后进行拼接,最后经过1x1卷积,效果都不够好,可以说不如注意力机制。 4:出自Deep Surface Normal Estimation with Hierarchical RGB-D Fusion,是用来预测表面法线的,还没有看,先挖个坑。 5:接着就是注意力机制,包括SA-Gate,将RGB和Depth进行拼接,然后经过global pooling操作,得到1x1卷积再与本身相乘,然后再经过拼接,经过softmax得到一个权重,与原始图片进行相乘,两个注意力都用到了,他的点在于图像的去噪,将图像分离,去噪,融合,再分离,再融合。 6:在ESANet中应用了SENet中的Sequeeze-and-Excitation模块,将RGB和Depth分别进行 Sequeeze-and-Excitation,经过通道注意力,会学到应该关注于那些通道,相当于某些通道乘了一个大的权重,然后再与深度进行融合。 6:除了应用SENet中即插即用的模块,CANet还应用了非局部注意力来融合RGB和Depth。这个方法在DANet的创新点上进行创新。 DANet: CANet: CANet意图很清晰,通过RGB和Depth进行非局部注意力,得到的权重乘以Depth,然后和RGB进行融合,分别在空间上和通道上进行注意力融合,得到的结果再进行1x1卷积和纹理融合,可以说融合的很充分了。

随便揣测一下,这些操作都像是非局部注意力和深度可分离卷积的变形,非局部注意力,通过两个modality进行注意力得到的权重乘以原来的图片,深度可分离卷积,通过卷积核来聚合多个通道的信息,在经过1x1卷积来进行空间的遍历。

综上这是目前看到的RGB和Depth融合策略,以后看到了再补充。 -------------------------------------------------------补充----------------------------------------------------------------------------------------------------- 7:最近读了一篇CMX**,是nyu数据集上排名第一的方法,包含了深度与RGB融合方法: 其中FRM模块与SA-Gate的方法十分类似,都是通过进行特征图校准来去噪,CMX通过逐通道校准和逐空间校准,最后生成两个输出,SA-Gate则是通过通道的压缩和聚合来实现的,不过本质上也是注意力。 除此以外CMX还是用了Transformer来进行特征的交互和融合,最后再通过一个通道编码得到最终输出。 ----------------------------------------------------------------------补充----------------------------------------------------------------------------------- 8:最近读了一篇FRNet,作者受到SA-Gate的启发,提出了一种跨层跨模态的融合策略。主要使用这种top-down结构,通过将高层次语义信息和低层次特征信息进行融合。 ----------------------------------------------------------------------补充----------------------------------------------------------------------------------- 9:这是一篇2022最新的文章,Attention-based Dual Supervised Decoder for RGBD Semantic Segmentation,没有代码。和之前的融合方法有差别,但是差别不大。每一层融合之后不连接,融合方法就是注意力,创新点主要是后面的双分支decoder。在depth分支上采样到最后起到了监督的作用。 ---------------------------------------------------------------补充---------------------------------------------------------------------------------- 10:TransD-Fusion:transformer用于RGB-D融合来进行语义分割,在两个分支encoder的尾部进行融合。通过自注意力,交叉注意力,深度引导三步进行融合。在NYU上的miou达到了55.5。其中融合的部位和CANet一样,融合的方法在CMX也使用到了,交叉的transformer注意力。 11:在看TransD-Fusion文章的时候,他引用了一篇文章PGDENet: Progressive Guided Fusion and Depth Enhancement Network for RGB-D Indoor Scene Parsing也是RGB-D融合的,我就进去看了一下架构图,和之前的FRNet几乎一样,模型很像,就不仔细看了。 主要看一下PCFM模块和DEM模块: 12:RGB‑D Gate‑guided edge distillation for indoor semantic segmentation文章引入了边界引导,RGB和Depth分别处理,其中融合的结果作为一条单独的分支进行传递。在边界特征部分用到了原始GT进行边缘提取的边缘损失。

本文链接地址:https://www.jiuchutong.com/zhishi/297492.html 转载请保留说明!

上一篇:nvm介绍、安装、报错处理以及使用(nvm安装教程)

下一篇:一天撸一个财务APP系统【安卓端+前端+后端】

  • 微信3.3.0正式版更新了哪些内容(微信3.3.0版本)

    微信3.3.0正式版更新了哪些内容(微信3.3.0版本)

  • 二线品牌如何跨入一线的行列(二线品牌如何跨境电商)

    二线品牌如何跨入一线的行列(二线品牌如何跨境电商)

  • 如何关闭网易云音乐锁屏显示(如何关闭网易云锁屏显示)

    如何关闭网易云音乐锁屏显示(如何关闭网易云锁屏显示)

  • 怎么清除手机内存(怎么清除手机内存卡里的东西)

    怎么清除手机内存(怎么清除手机内存卡里的东西)

  • 华为手机自检功能在哪(华为手机自检功能代码)

    华为手机自检功能在哪(华为手机自检功能代码)

  • 苹果11底部横线怎么关闭(苹果11底部横线怎么去掉)

    苹果11底部横线怎么关闭(苹果11底部横线怎么去掉)

  • 华为手机怎么把智慧语音关闭(华为手机怎么把通讯录导入手机卡)

    华为手机怎么把智慧语音关闭(华为手机怎么把通讯录导入手机卡)

  • 酷狗mv为什么不能投屏(酷狗mv为什么不播放)

    酷狗mv为什么不能投屏(酷狗mv为什么不播放)

  • knttl10是华为啥型号(trttl10a华为什么型号)

    knttl10是华为啥型号(trttl10a华为什么型号)

  • 苹果11指纹识别在哪(苹果11有指纹识别吗)

    苹果11指纹识别在哪(苹果11有指纹识别吗)

  • 苹果7p送话器在哪个孔(苹果七送话器)

    苹果7p送话器在哪个孔(苹果七送话器)

  • 电脑切换窗口快捷键(电脑切换窗口快捷键怎么设置其他按键)

    电脑切换窗口快捷键(电脑切换窗口快捷键怎么设置其他按键)

  • qq怎么扩列加好友(qq扩列加好友来源显示什么)

    qq怎么扩列加好友(qq扩列加好友来源显示什么)

  • 华为mate30pro5g颜色(华为mate30pro4g颜色)

    华为mate30pro5g颜色(华为mate30pro4g颜色)

  • 路由器的作用与功能(路由器的作用与功能通俗易懂)

    路由器的作用与功能(路由器的作用与功能通俗易懂)

  • iphonexsmax有指纹识别吗(xs max有指纹)

    iphonexsmax有指纹识别吗(xs max有指纹)

  • 苹果x有耳机插口没(苹果x插有线耳机还是外放)

    苹果x有耳机插口没(苹果x插有线耳机还是外放)

  • 天猫店铺关了找谁售后(天猫店铺关了找不到商家)

    天猫店铺关了找谁售后(天猫店铺关了找不到商家)

  • 钉钉文件怎么发到微信(钉钉文件怎么发给微信)

    钉钉文件怎么发到微信(钉钉文件怎么发给微信)

  • iphone运营商怎么更新(iphone运营商怎么改名)

    iphone运营商怎么更新(iphone运营商怎么改名)

  • 快手怎么打开歌房(快手怎么打开歌词功能)

    快手怎么打开歌房(快手怎么打开歌词功能)

  • 苹果双系统能不能升级win11 mac系统安装win11教程和系统下载(苹果双系统不小心删了苹果系统)

    苹果双系统能不能升级win11 mac系统安装win11教程和系统下载(苹果双系统不小心删了苹果系统)

  • 卷积神经网络学习—Resnet50(论文精读+pytorch代码复现)(卷积神经网络课程)

    卷积神经网络学习—Resnet50(论文精读+pytorch代码复现)(卷积神经网络课程)

  • 新公司第一年要做亏
  • 所得税为什么比利润高
  • 企业所得税从业人数怎么填,依据什么填写
  • 收据收到写什么
  • 分公司可以独立开银行账户吗
  • 以前年度计提的工资没发放怎么处理
  • 金融工具减值的简化处理
  • 减免税款抵税怎么做分录
  • 企业收到税收返还会计分录
  • 单据核销不了
  • 没开发票可以确认收入吗?
  • 付款时没有发票怎么做账
  • 开具的增值税专用发票上注明的金额
  • 年底结账会计处理
  • 哪些罚款不能进行所得税税前扣除?
  • 增值税税控系统的税务处理
  • 小规模纳税人附加税减免政策2023
  • 普通发票冲红的限制几张以上
  • 增值税零税率发票开具条件
  • 税务登记五证合一是哪五证
  • 外币投入资本不产生汇兑损益
  • 买入返售金融资产什么意思
  • 软件企业即征即退账务处理
  • 房屋融资租赁会计处理
  • macqq截图快捷键 保存
  • windows11怎么打开设置
  • 春节发放物品计入什么科目
  • 如何向企业支付宝收款
  • 临时工工资的会计处理和税务处理
  • 收到完税凭证怎么做账
  • 现金流量套期的分录
  • php缓存数据到内存
  • 工业企业成本核算会计分录
  • 什么叫奖励旅游
  • 预收账款的账务处理摘要
  • 啥叫同比增长
  • 会计核算形式的定义
  • java枚举写法
  • 企业如何利用期货对冲风险怎么操作
  • 固定资产的原价包括增值税吗
  • 进项税额申报表怎么填写
  • php array_fill
  • 增值税发票如何作废流程
  • 小规模纳税人怎么开专票
  • 员工意外伤害险入什么会计科目
  • 民宿的房屋租赁费怎么算
  • 哪些员工出差的多
  • 合同履约成本与一份当前或预期取得的区别
  • 专用设备技术维护费
  • 应纳税额和已缴税额一样
  • 请问母公司如何称呼
  • 厂家核销费用直接扣除吗
  • 当月扣缴社保分录
  • 待认证进项税额和待抵扣进项税额的区别
  • 小规模商贸公司没有进项票怎么办
  • 发票找不到了怎么操作
  • 发票章盖得不清晰怎么办
  • sqlserver数据类型怎么用
  • 如何恢复win8系统
  • 硬盘安装在机箱内,属于主机的组成部分
  • 360安全卫士中心未完全开启
  • win10 outlook邮箱设置教程
  • win10开机后没声音
  • android:PopupWindow的使用场景和注意事项
  • js响应式布局
  • 计算机图形学和计算机视觉的区别
  • 如何创建node项目
  • 基于豆瓣电影数据linux
  • git 删除分支和回滚的实例详解
  • numpy体会
  • jquery div滚动条
  • 关闭计算机盖的功能
  • Android自定义系统服务框架
  • 怎样纳税申报和缴纳
  • 专项调查法
  • 就业核查怎么核查
  • 税务师事务所企业组织架构
  • 电信业八大争议事件
  • 税务筹划怎么样
  • 汽车燃油税每年要交吗
  • 免责声明:网站部分图片文字素材来源于网络,如有侵权,请及时告知,我们会第一时间删除,谢谢! 邮箱:opceo@qq.com

    鄂ICP备2023003026号

    网站地图: 企业信息 工商信息 财税知识 网络常识 编程技术

    友情链接: 武汉网站建设