位置: IT常识 - 正文

基于Vision Transformer的图像去雾算法研究与实现(附源码)(基于专业性的家校双向互动,需要家长的学校教育参与)

编辑:rootadmin
基于Vision Transformer的图像去雾算法研究与实现(附源码) 基于Vision Transformer的图像去雾算法研究与实现0. 服务器性能简单监控

推荐整理分享基于Vision Transformer的图像去雾算法研究与实现(附源码)(基于专业性的家校双向互动,需要家长的学校教育参与),希望有所帮助,仅作参考,欢迎阅读内容。

文章相关热门搜索词:基于专业性的家校双向互动,需要家长的学校教育参与,基于网页的客服系统,基于网络创新形成的大数据的最突出特征是什么?( ),基于vision transformer的图像分类程序设计,基于是什么意思,基于核心素养下的大单元教学设计,基于vision transformer的图像分类程序设计,基于vision transformer的图像分类程序设计,内容如对您有帮助,希望把文章链接给更多的朋友!

\LOG_USE_CPU_MEMORY\文件夹下的use_memory.py文件可以实时输出CPU使用率以及内存使用率,配合nvidia-smi监控GPU使用率

可以了解服务器性能是否足够;运行时在哪一步使用率突然升高;是否需要释放内存等等

1. 数据集1.1 NH-HAZE

数据集下载: https://competitions.codalab.org/competitions/22236#participate-get_data

Train:1-40;Test:41-45

我们引入了NH-HAZE,一个非均匀的真实数据集,有成对真实的模糊和相应的无雾图像。因此,非均匀雾霾数据集的存在对于图像去雾场是非常重要的。

它代表第一个真实的图像去模糊数据集与非均匀的模糊和无模糊(地面真实)配对图像

为了补充之前的工作,在本文中,我们介绍了NH-HAZE,这是第一个具有非均匀模糊和无雾(地面真实)图像的真实图像去模糊数据集。

1.2 NTIRE 2019

DENSE-haze是一个真实的数据集,包含密集(均匀)模糊和无烟雾(地面真实)图像

官方地址:

https://data.vision.ee.ethz.ch/cvl/ntire19/#:~:text=Datasets%20and%20reports%20for%20NTIRE%202019%20challenges

https://data.vision.ee.ethz.ch/cvl/ntire19//dense-haze/

另一个下载地址:

https://www.kaggle.com/rajat95gupta/hazing-images-dataset-cvpr-2019?select=GT

Train:1-45;Test:51-55

1.3 I-HAZE

其中包含 35 对有雾的图像和相应的无雾(真实)室内图像

下载地址:https://data.vision.ee.ethz.ch/cvl/ntire18//i-haze/

Train:1-25;Test:31-35

1.4 O_HAZE

O-HAZE是第一个引入的包含模糊和无烟雾(地面真实)图像的真实数据集。它由45个不同的户外场景组成,使用一个专业的雾霾发生器在控制照明下拍摄。而O-HAZE和I-HAZE则由相对较轻、均匀的雾霾组成

下载地址:https://data.vision.ee.ethz.ch/cvl/ntire18//o-haze/

Train:1-35;Test:41-45

我们使用NH-HAZE数据集作为举例数据集,其他数据集除了数据集路径之外,大多数参数设置都一样。

该去雾项目源码下载:

https://download.csdn.net/download/DeepLearning_/87570157

2. 模型运行过程2.0 模型介绍

在文件夹/Uformer_ProbSparse/下存放模型代码

参考代码:https://github.com/ZhendongWang6/Uformer

2.1 预处理数据 — 把训练数据图像切分成大小为256*256的小图

下载数据集存放在:

/home/dell/桌面/TPAMI2022/Dehazing/#dataset/NH_haze/

内含两个文件夹:train test

对训练数据集处理:

python3 generate_patches_SIDD.py --src_dir /home/dell/桌面/TPAMI2022/Dehazing/#dataset/NH_haze/train --tar_dir /home/dell/桌面/2022毕业设计/Datasets/NH-HAZE/train_patches2.2 训练代码My_train.pypython3 ./My_train.py --arch Uformer --nepoch 270 --batch_size 32 --env My_Infor_CR --gpu '1' --train_ps 128 --train_dir /media/dell/fd6f6662-7e38-4427-80c6-0d4fb1f0e8b9/work_file/2022毕业设计/Datasets/NH-HAZE/train_patches --val_dir /media/dell/fd6f6662-7e38-4427-80c6-0d4fb1f0e8b9/work_file/2022毕业设计/Datasets/NH-HAZE/test_patches --embed_dim 32 --warmup基于Vision Transformer的图像去雾算法研究与实现(附源码)(基于专业性的家校双向互动,需要家长的学校教育参与)

如果要继续对模型进行训练:--pretrain_weights 设置预训练权重路径,我的模型预训练权重在My_best_model文件夹下,以数据集划分不同预训练权重

并添加参数 --resume

训练所有参数设置在option.py文件种,主要的参数含义:

--train_ps 训练样本的补丁大小,默认为128,指多大的patches输入到模型中--train_dir --val_dir 训练和测试文件夹,文件夹下包含两个文件夹gt和hzay,分别包含无雾图片集和带雾图片集--batch_size 设置Batch_size,默认为3--is_ab **是否使用n a对比损失,默认为False(使用)--w_loss_vgg7对比损失使用的权重,默认为1--w_loss_CharbonnierLoss CharbonnierLoss 所占权重,默认为1**2.3 测试代码test_long_GPU.py和预训练权重

预训练权重:

链接:https://pan.baidu.com/s/1a1YPTGSNa0R6I-qiTNir0A 提取码:y422

模型预训练权重:将百度网盘中的Uformer_ProbSparse/My_best_model文件夹放到Uformer_ProbSparse文件夹下,里面包含4大数据集下的权重

python3 ./test_long_GPU.py

测试流程:

在My_train.py文件中,为了训练速度考虑,我们是在每个patch上进行的测试,但patch上测试结果不等于在整图上测试的结果,因此该文件是对模型在整图上结果进行测试,论文中的结果与该测试结果一致

由于代码的特殊设置,需要让输入的图片的长和宽为 --train_ps 的整数倍,如果不够足,则要进行扩展

主要参数解释:

--input_dir 设置测试的文件夹,文件夹下包含两个文件夹gt和hzay,分别包含无雾图片集和带雾图片集

--train_ps训练样本的补丁大小,默认为128,指多大的patches输入到模型中

代码中的: L表示图像需要拓展长和宽为多大

例如:输入是1200 * 1600,patch size = 128时,L = 1664

L需要为128倍数,且要大于输入图像的长和宽,需要根据输入图像进行调整,例如:NH-HAZE数据集上的为L = 1664

3. NH-HAZE数据集上的Losslandscape

主要将最优权重的周围的loss可视化,以探索模型收敛的难易程度以及模型架构的性能

参考文献:Park N, Kim S. How Do Vision Transformers Work?[J]. arXiv preprint arXiv:2202.06709, 2022.

3.1 基于CNN模型(FFA-Net)的Loss landscape

预训练权重:

链接:https://pan.baidu.com/s/1a1YPTGSNa0R6I-qiTNir0A 提取码:y422

模型预训练权重:将百度网盘中的FFA_how-do-vits-work-transformer文件夹包含的内容放到FFA_how-do-vits-work-transformer文件夹下,里面包含FFA-Net在NH-HAZE数据集下的最优权重,以及该权重下运行的结果

在/FFA_how-do-vits-work-transformer/FFA_pretrain_weight/下存放FFA-Net模型在该数据集下的预训练权重,决定预训练权重的路径代码在/FFA_how-do-vits-work-transformer/FFA_model/option.py

主要代码FFA_losslandscape.py:在最优权重周围随机找121个权重,然后计算这些权重的loss值,得到的loss值保存在/FFA_how-do-vits-work-transformer/checkpoints/logs/FFA_NH/My_NH_ffa_3_19_best.pk/文件夹下用于绘图,得到的Loss landscape如下:

3.2 基于Vision Transformer架构改进后的Loss landscape

预训练权重:

链接:https://pan.baidu.com/s/1a1YPTGSNa0R6I-qiTNir0A 提取码:y422

模型预训练权重在2.3节有阐述

将百度网盘中的how-do-vits-work-transformer文件夹包含的内容放到how-do-vits-work-transformer文件夹下,下面有讲解文件夹内包含的内容

在/Uformer_ProbSparse/My_best_model/下存放改进后模型在各种数据集下的预训练权重,决定预训练权重的路径代码在/how-do-vits-work-transformer/Uformer_Info/option.py中的--pretrain_weights设置对应数据集上最优的参数权重路径

主要代码My_losslandscape.py:在最优权重周围随机找121个权重,然后计算这些权重的loss值,得到的loss值保存在/how-do-vits-work-transformer/checkpoints/logs/NH/Uformer_Informer/文件夹下用于绘图,得到的Loss landscape如下:

在实践过程中,通常运行My_losslandscape.py代码就可以直接得到下图

但在我运行过程中,因为服务器断电,只能继续训练,因此\how-do-vits-work-transformer\checkpoints\logs\NH\Uformer_Informer\下的middle_result.txt和NH_Uformer_Informer_x1_losslandscape.csv是两次运行文件中间结构,而losslandscape.ipynb中融合了两次运行结果得到该图

Park N, Kim S. How Do Vision Transformers Work?[J]. arXiv preprint arXiv:2202.06709, 2022.提到:损失景观越平坦,性能和泛化效果越好

可以发现:我们基于Vision Transformer架构改进后的模型和FFA-Net模型在最优参数时的Loss landscape,能够反应出我们的模型收敛效果比较好这与训练过程一致:我们的模型训练270个epoch就会收敛,而FFA-Net则需要40000个epoch

4. 实验结果

根据恢复图的结果,我们发现在部分图上的效果并不是特别优异

**可以很好的反应Vision Transformer的劣势:该架构虽然全局建模能力强,但局部建模能力没有CNN强,因此当输入某物体占大部分空间时,恢复结果容易受到其影响;因此可以在之后改进中使用CNN和Transformer组合模型,共同对全局和局部进行建模。

5. 消融实验6. 总结展望

本文链接地址:https://www.jiuchutong.com/zhishi/298665.html 转载请保留说明!

上一篇:CTF—web题库笔记(难度1)(ctf web2)

下一篇:十七届智能车智能视觉组(十四届智能车规则)

  • 微信扫脸验证在哪里设置(微信验证脸部识别在哪里)

    微信扫脸验证在哪里设置(微信验证脸部识别在哪里)

  • 小米civi怎么开性能模式(小米civi怎么开空调)

    小米civi怎么开性能模式(小米civi怎么开空调)

  • 华为荣耀20青春版多少快充(华为荣耀20青春版有没有nfc功能)

    华为荣耀20青春版多少快充(华为荣耀20青春版有没有nfc功能)

  • qq如何设置自动回复(qq如何设置自动抢红包)

    qq如何设置自动回复(qq如何设置自动抢红包)

  • qq课堂排麦是什么意思(qq直播课堂排麦什么意思)

    qq课堂排麦是什么意思(qq直播课堂排麦什么意思)

  • 启动hadoop的命令行(hadoop启动成功界面)

    启动hadoop的命令行(hadoop启动成功界面)

  • 华为手机不小心把桌面天气删了怎么添加(华为手机不小心卸载的软件怎么找回来)

    华为手机不小心把桌面天气删了怎么添加(华为手机不小心卸载的软件怎么找回来)

  • 电脑没电关机了文档没保存怎么办(电脑没电关机了要充多久才能开机)

    电脑没电关机了文档没保存怎么办(电脑没电关机了要充多久才能开机)

  • ipad进水变成耳机模式(苹果平板进水变成耳机模式了怎么恢复)

    ipad进水变成耳机模式(苹果平板进水变成耳机模式了怎么恢复)

  • 苹果手机怎么设置软件加密码(苹果手机怎么设置陌生号码拦截)

    苹果手机怎么设置软件加密码(苹果手机怎么设置陌生号码拦截)

  • acer电脑开不了机怎么办(acer电脑开不了机)

    acer电脑开不了机怎么办(acer电脑开不了机)

  • 什么叫互动播放(互动播放的电视剧有哪些)

    什么叫互动播放(互动播放的电视剧有哪些)

  • 抖音只能用手机登录吗(抖音只能用手机号登录吗,别的号能不能登录)

    抖音只能用手机登录吗(抖音只能用手机号登录吗,别的号能不能登录)

  • 抖音带货是什么意思(抖音带货是什么意思?带一次货能赚多少钱?(派代网))

    抖音带货是什么意思(抖音带货是什么意思?带一次货能赚多少钱?(派代网))

  • 手机怎么截动态屏(手机怎么截长图 滚动截屏)

    手机怎么截动态屏(手机怎么截长图 滚动截屏)

  • 58同城暂不活跃是什么意思(58同城暂不活跃了)

    58同城暂不活跃是什么意思(58同城暂不活跃了)

  • ppt2010自带主题在哪(ppt主题设置在哪个选项卡中)

    ppt2010自带主题在哪(ppt主题设置在哪个选项卡中)

  • 苹果11怎么重启(苹果11怎么重启关机)

    苹果11怎么重启(苹果11怎么重启关机)

  • 剪映怎么自动添加字幕(剪映怎么自动添加字幕和配音)

    剪映怎么自动添加字幕(剪映怎么自动添加字幕和配音)

  • ppt超级链接在哪(ppt2003超级链接)

    ppt超级链接在哪(ppt2003超级链接)

  • 为什么目录显示不完全(为什么目录显示蓝色)

    为什么目录显示不完全(为什么目录显示蓝色)

  • 怎么查看拼多多的消费(怎么查看拼多多买过的东西)

    怎么查看拼多多的消费(怎么查看拼多多买过的东西)

  • win7系统怎么重装(win7系统怎么重置开机密码)

    win7系统怎么重装(win7系统怎么重置开机密码)

  • 删除的通话记录怎么恢复(删除的通话记录在营业厅能查到吗?)

    删除的通话记录怎么恢复(删除的通话记录在营业厅能查到吗?)

  • 国际重复征税的前提条件是
  • 进项税转出的会计处理方法
  • 100万劳务费发票多少税
  • 交了进口增值税还要交增值税吗
  • 会计工作的基本认识
  • 租赁的房租再出租成本怎么做?
  • 用友软件作废凭证
  • 银行客户专用回单分录
  • 别人项目挂靠我单位如何进行账务处理?
  • 银行已扣社保会计分录怎么做
  • 诉讼管辖分为
  • 加油充值卡有优惠吗
  • 待认证税额是几级科目
  • 工会筹备金需要在年终汇算调增吗
  • 普通征税差额征税减按征税
  • 公司用窗帘用什么颜色
  • 转籍车辆是什么意思
  • 技术服务费属于什么大类
  • 什么叫保理支付
  • 自产房产部分出租后的房产税怎么交?
  • 服务业核定征收税率表
  • 建筑完税怎么计算
  • 怎么让自己的电脑有网吧认证
  • 车间日常维修费用计入什么科目
  • windows10无法打开图片
  • 企业所得税汇算表
  • 其他应付款无法支付的账务处理方法
  • PHP:pg_field_type()的用法_PostgreSQL函数
  • 贴现短期无息应付票据
  • wordpress抓取网页
  • igfxhk.exe是什么进程
  • 劳务派遣发票会扣税吗
  • 投影仪属于固定资产哪一类
  • 驾校属于什么行业分类类别
  • php function函数的用法
  • SwinIR实战:详细记录SwinIR的训练过程
  • yolov3多分类检测
  • 模型未来的发展趋势
  • taskset命令详解
  • 银行贷款入账需要什么
  • 企业网银证书年费是什么
  • c语言asc函数
  • phpcms使用教程
  • 房产税在企业所得税扣除内吗
  • 受托方代收代缴的消费税应计入什么科目
  • SQL Server 2008用'sa'登录失败,启用'sa'登录的解决办法
  • 招待费专票不可以抵扣
  • 兼职老师工资小时多少钱
  • 实收资本的印花税什么时候申报
  • 应付账款扣款分录
  • 实收资本后面带人名吗
  • 国际货运公司支付境外运费
  • 与其他企业联营
  • 委托付款做账怎么做
  • 费用报销单和支付证明单的区别
  • 服务费的进项发票怎么做分录
  • 单位固定资产统计表
  • 职工薪酬包括哪四项内容
  • 如何设置sql server
  • 苹果电脑截图快捷键
  • winxp破解登录密码
  • linux xfs 扩容
  • windows桌面卡
  • [置顶]电影名字《收件人不详》
  • js表单验证代码Email
  • JavaScript的21条基本知识点
  • 改变图片透明度怎么调
  • bootstrap基础教程
  • jquery教程chm
  • javascript定律
  • 使用chrome浏览器打开
  • bash fi
  • 法线贴图使用
  • jquerycdn
  • android 开源
  • python中os模块有什么作用
  • 车辆购置税是财行税吗
  • 丰田威驰2023款1.5自动挡新车报价
  • 应税销售额如何计算
  • 深圳市公安局的位置
  • 免责声明:网站部分图片文字素材来源于网络,如有侵权,请及时告知,我们会第一时间删除,谢谢! 邮箱:opceo@qq.com

    鄂ICP备2023003026号

    网站地图: 企业信息 工商信息 财税知识 网络常识 编程技术

    友情链接: 武汉网站建设