位置: IT常识 - 正文

图像融合、Transformer、扩散模型(图像融合名词解释)

编辑:rootadmin
图像融合、Transformer、扩散模型

推荐整理分享图像融合、Transformer、扩散模型(图像融合名词解释),希望有所帮助,仅作参考,欢迎阅读内容。

文章相关热门搜索词:图像融合的主要目的是,图像融合的目的,图像融合名词解释,图像融合的三大方法,图像融合的主要目的是,图像融合transformer,图像融合的三大方法,图像融合的主要目的是,内容如对您有帮助,希望把文章链接给更多的朋友!

        在这篇博客中,主要是收集到一些图像融合框架中引入Transformer结构的文章,提供给大家参考学习,目前图像融合领域引入Transformer结构的文章比较少(我所看到的比较少,也看可能我看的比较少?),主要作用就是把它作为一种提取特征的方式,或者说更倾向于long-range dependencies的建立。Transformer引入到图像融合领域的时间并不长,大部分文章都是2020-2022发出的,所有并没有统计发表年份。至于是具体是哪个会议或者期刊发表的并没有标注,有兴趣可以自己去查查。

       Transformer 主要是通过自注意力学习图像斑块之间的全局空间关系。 自注意力机制致力于建立long-range dependencies,从而在浅层和深层中更好地利用全局信息,所以 Transformer 的使用就是解决长序列问题的一个好方法。在 CV 领域中常用的就是 CNN,它可以提取本地的特征,因为每次卷积就是提取该卷积下的特征图,在局部信息的提取上有很大优势,但无法关注图像的长期依赖关系,阻碍了复杂场景融合的上下文信息提取。所以, Transformer 的引入主要解决这个问题。

        下面这个思维导图从单任务和多任务的角度进行设计的,简单看看吧!!!

 下面这个表格是论文的名称,以及在网络结构上进行了总结。

CNN+Transformer结构文章类型代码Image Fusion TransformerVIF文中提供了代码链接MFST: Multi-Modal Feature Self-Adaptive Transformer for Infrared and Visible Image FusionVIFDNDT: Infrared and Visible Image Fusion Via DenseNet and Dual-TransformerVIFTransMEF: A Transformer-Based Multi-Exposure Image Fusion Framework using Self-Supervised Multi-Task LearningMEF图像融合、Transformer、扩散模型(图像融合名词解释)

文中提供了代码链接

TransFuse: A Unified Transformer-based Image Fusion Framework using Self-supervised Learning

Unified Framework

文中提供了代码链接TGFuse: An Infrared and Visible Image Fusion Approach Based on Transformer and Generative Adversarial NetworkVIFSwinFusion: Cross-domain Long-range Learning for General Image Fusion via Swin TransformerUnified Framework文中提供了代码链接CGTF: Convolution-Guided Transformer for Infrared and Visible Image FusionVIFPure Transformer结构(这两篇都是预训练模型做的)SwinFuse: A Residual Swin Transformer Fusion Network for Infrared and Visible ImagesVIF文中提供了代码链接PPT Fusion: Pyramid Patch Transformer for a Case Study in Image FusionUnified Framework新增THFuse: An infrared and visible image fusion network using transformer and hybrid feature extractorVIFIFormerFusion: Cross-Domain Frequency Information Learning for Infrared and Visible Image Fusion Based on the Inception TransformerVIFBreaking Free from Fusion Rule: A Fully Semantic-driven Infrared and Visible Image FusionVIF扩散模型Dif-Fusion: Towards High Color Fidelity in Infrared and Visible Image Fusion with Diffusion ModelsVIF,扩散彩色通道特征

        上述论文的实验部分都是比较的卷积方法或者传统方法,并没有比较到使用到Transforme的模型,所以他们之间的是啥情况,那就不清楚了,没刻意去比较过,有兴趣可以去比较比较。That thing is not sure!!!

        思考:怎么把Tranformer合理的引入到CNN结构中进行图像融合以及如何真正地将Transformer用到图像融合融合中(完全使用Transformer去构建图像融合模型) ??? 

        目前,只收集到这些文章。。如有错误,希望大家看到后及时在评论区留言!!!

        另外,如果想更多的关注图像融合领域相关的知识,大家可以关注以下优秀的博主:

1:部分基于深度学习的红外与可见光图像融合模型总结 - 知乎 (zhihu.com)

2:(7条消息) 红外和可见光图像融合论文及代码整理_Timer-419的博客-CSDN博客_图像融合论文

        希望对大家有帮助,欢迎大家补充!!!

2023.3.17新增、扩散模型!!!

本文链接地址:https://www.jiuchutong.com/zhishi/296104.html 转载请保留说明!

上一篇:YOLOv8(n/s/m/l/x)&YOLOv7(yolov7-tiny/yolov7/yolov7x)&YOLOv5(n/s/m/l/x)不同模型参数/性能对比(含训练及推理速度)

下一篇:对Transformer中Add&Norm层的理解(transformer中的参数)

  • 手机发现病毒怎么处理才是对的(手机发现病毒危险不处理行不行?)

    手机发现病毒怎么处理才是对的(手机发现病毒危险不处理行不行?)

  • 如何查微信聊天记录(如何查微信聊天记录条数)

    如何查微信聊天记录(如何查微信聊天记录条数)

  • 荣耀x10指纹在哪里(华为荣耀x10手机在哪里能够找到指纹解锁)

    荣耀x10指纹在哪里(华为荣耀x10手机在哪里能够找到指纹解锁)

  • 苹果7wifi开关打不开(苹果七wi-fi按钮打不开是什么情况)

    苹果7wifi开关打不开(苹果七wi-fi按钮打不开是什么情况)

  • 怎么退出快手主播粉丝团(怎么退出快手主播的粉丝团群)

    怎么退出快手主播粉丝团(怎么退出快手主播的粉丝团群)

  • 为什么解封微信人脸识别失败(为什么解封微信一直是激活失败)

    为什么解封微信人脸识别失败(为什么解封微信一直是激活失败)

  • 手机qq关闭黄钻标识.(手机qq关闭黄钻自动续费)

    手机qq关闭黄钻标识.(手机qq关闭黄钻自动续费)

  • 手机相机的专业模式中有哪些设置(手机相机的专业模式怎么调最好)

    手机相机的专业模式中有哪些设置(手机相机的专业模式怎么调最好)

  • 微信在什么情况下会被限制登录(微信在什么情况下不能转账和发红包)

    微信在什么情况下会被限制登录(微信在什么情况下不能转账和发红包)

  • opporeno3pro没有耳机孔咋办(opporeno没有耳机)

    opporeno3pro没有耳机孔咋办(opporeno没有耳机)

  • 钉钉直播有回声怎么办(钉钉直播有回声重复说话)

    钉钉直播有回声怎么办(钉钉直播有回声重复说话)

  • 打印预览和打印出来的不一样(打印预览和打印出来的图片不一样)

    打印预览和打印出来的不一样(打印预览和打印出来的图片不一样)

  • 京东付款后不显示订单(京东付款了可以我的订单不显示怎么办)

    京东付款后不显示订单(京东付款了可以我的订单不显示怎么办)

  • 知乎的邀请是随机的吗(知乎邀请好友有什么奖励)

    知乎的邀请是随机的吗(知乎邀请好友有什么奖励)

  • 计算机的三大应用领域是(计算机的三个应用领域)

    计算机的三大应用领域是(计算机的三个应用领域)

  • 沾沾卡能复制全家福吗(沾沾卡可以指定沾哪张吗)

    沾沾卡能复制全家福吗(沾沾卡可以指定沾哪张吗)

  • word文档怎么纵向排版(word文档怎么纵向打字)

    word文档怎么纵向排版(word文档怎么纵向打字)

  • 华为密码忘了怎么办(华为密码忘了怎么办 锁屏)

    华为密码忘了怎么办(华为密码忘了怎么办 锁屏)

  • word怎么安装到电脑上(word怎么安装到其他盘)

    word怎么安装到电脑上(word怎么安装到其他盘)

  • ps的图层蒙版怎么用(ps的图层蒙版怎么做)

    ps的图层蒙版怎么用(ps的图层蒙版怎么做)

  • ps怎么调夜景(ps怎么把夜景图片变清晰)

    ps怎么调夜景(ps怎么把夜景图片变清晰)

  • 手机可以呼叫转移吗(手机可以呼叫转移到400电话吗)

    手机可以呼叫转移吗(手机可以呼叫转移到400电话吗)

  • 华为nova5pro怎么局部截屏(华为nova5pro怎么录屏)

    华为nova5pro怎么局部截屏(华为nova5pro怎么录屏)

  • 衡量计算机的性能指标有(衡量计算机性能的主要技术指标是)

    衡量计算机的性能指标有(衡量计算机性能的主要技术指标是)

  • iponexr怎么更新ios13(iphonexr怎么更新)

    iponexr怎么更新ios13(iphonexr怎么更新)

  • 什么协议是提供不可靠的数据传输的(什么协议是提供无面向链接,确保路由的正确选择)

    什么协议是提供不可靠的数据传输的(什么协议是提供无面向链接,确保路由的正确选择)

  • word是英文版怎么改成中文(word英文版怎么调行距)

    word是英文版怎么改成中文(word英文版怎么调行距)

  • CSS 实现六边形柱状图(html六边形的盒子怎么做)

    CSS 实现六边形柱状图(html六边形的盒子怎么做)

  • 网站用masonry瀑布流无限加载重叠解决方法

    网站用masonry瀑布流无限加载重叠解决方法

  • 小规模纳税人增值税减免账务处理
  • 稳岗返还多久能到账
  • 差旅费计入工资成本吗
  • 一般企业都涉及到哪些税
  • 收到赔偿款怎么做分录
  • 高速公路通行费发票可以抵扣增值税吗
  • 生产企业固定资产折旧
  • 一般纳税人制作除尘器的制作费开票税率是多少
  • 计提税费怎么写分录
  • 对非本单位的营销方案
  • 收取招标代理费会计分录
  • 打官司失败了要赔偿原告诉讼费吗?
  • 河道工程维护管理费征收
  • 留抵进项税抵欠税后期末未交增值税会减少吗
  • 哪些税不适用征管法
  • 经营性租赁购入会计分录
  • 转出未交增值税怎么算
  • 税控盘费用冲减管理费用还是营业外收入?
  • 小规模国税地税怎么交
  • 以旧换新增值税税率是多少
  • 红字专用发票信息表编号在哪儿
  • 企业年会的费用会计分录
  • 电梯销售和安装怎么核算收入
  • Win11怎么不显示图标
  • 企业之间的往来款现金流
  • 卖废旧物品账务处理
  • 会计科目暂存款是什么意思
  • 一些出口商为什么要倾销
  • mac 如何u盘启动
  • 注销公司财务报表范本
  • 利润表里的所得税费用怎么算出来的
  • 基于opencv的图像处理
  • 为公司垫付费用,怎么要回
  • php图形图像处理技术
  • stacking 集成
  • input输入改变边框颜色
  • 2021前端热门技术解读
  • 进口固定资产支付的关税
  • php clob
  • Uncaught SyntaxError: Unexpected token '<' (at 报错
  • 企业提前还贷为什么违约
  • 改造后的固定资产入账价值
  • 净资产小于注册资本
  • 以前年度未入账固定资产账务处理
  • 一联发票和二联发票
  • 建筑行业旧项目怎么处理
  • 一般纳税人条件要求2020
  • 现金日记账采用哪一种账簿的形式
  • 装载机如何计提折旧费用
  • 发票红字怎么弄
  • 生产成本要如何核算
  • 商品预计退回会扣钱吗
  • 蓝字发票怎么作废
  • 收到红字增值税发票哪里查
  • 会计收入的定义和分类
  • mysql 表分区
  • centos8复制文件
  • skyleap用不了
  • mac怎么打开macintosh
  • linux或者命令
  • linux安装flash插件
  • 安装centos7.0
  • 强缓存标志
  • linux bas
  • win8系统安装包
  • shell(bash)下“time” 命令的输出详解
  • Python中lambda的作用
  • 学习英语
  • JavaScript事件代理和委托详解
  • nodejs requirejs
  • android camera preview
  • vue实现淘宝布局
  • Python编程中的逻辑与控制
  • jquery获取url地址
  • 怎么查其他公司的财务报表
  • 珠海市中心
  • 地方税务局工作内容
  • 基层税收工作的建议意见
  • 村纪检书记主要工作
  • 工商注册app是不是在手机上可以完全操作
  • 免责声明:网站部分图片文字素材来源于网络,如有侵权,请及时告知,我们会第一时间删除,谢谢! 邮箱:opceo@qq.com

    鄂ICP备2023003026号

    网站地图: 企业信息 工商信息 财税知识 网络常识 编程技术

    友情链接: 武汉网站建设