位置: IT常识 - 正文

超分算法之SRCNN(超分模型)

编辑:rootadmin
超分算法之SRCNN

推荐整理分享超分算法之SRCNN(超分模型),希望有所帮助,仅作参考,欢迎阅读内容。

文章相关热门搜索词:超分系统,超分系统,超分技术,超分算法原理,超分模型,超分技术,srcnn超分辨算法训练,srcnn超分辨算法训练,内容如对您有帮助,希望把文章链接给更多的朋友!

这篇文章是2014年的一篇论文,其主要意义在于作者推出的SRCNN是深度学习在超分上开篇之作!SRCNN证明了深度学习在超分领域的应用可以超越传统的插值等办法取得较高的表现力。

参考目录: ①深度学习图像超分辨率开山之作SRCNN(一)原理分析 ②深度学习端到端超分辨率方法发展历程

SRCNN1 SRCNN简介2 SRCNN模型结构3 Loss function:4 实验4.1 setup4.2 实验结果4.2.1 performance4.2.2 runtime5 进一步研究5.1 滤波器学习情况5.2 ImageNet学习5.3 滤波器数量5.4 滤波器大小6 效果展示7 总结1 SRCNN简介

作者推出了一种基于SISR的超分方法。这种方法基于深度学习,旨在实现一种端对端的网络模型——SRCNN,其用于将低分辨率的图像转换为高分辨图像。作者指出,SRCNN在当时的数据集下达到了SOAT的水平。

SRCNN具有结构简单且低失真度的特点:如上图所示,只需要一定的训练回合,SRCNN就可以超过传统的超分方法。

在一定数量的卷积层结构下,SRCNN可以达到fast-training。

实验表明,在一定范围内,越大的数据集和较大的网络模型可以提升SRCNN对图像的重建效果。

2 SRCNN模型结构

首先说明以下符号的含义:

YYY:输入图像经过预处理(双三次插值)得到的图像,我们仍将YYY当作是低分辨率图像,但它的size要比输入图像要大。F(Y)F(Y)F(Y):网络最后输出的图像,我们的目标就是通过优化F(Y)F(Y)F(Y)和Ground-Truth之间的loss来学会这个函数F(⋅)F(\cdot)F(⋅)。XXX:高分辨率图像,即Ground-Truth,它和YYY的size是相同的。

如上图所示是SRCNN的网络模型,其分为三部分,分别是: ①:Patch extraction and representation(其实就是图像特征提取层)。通过CNN将图像YYY的特征提取出来存到向量中,这个向量里包含了多张feature map,即一张图所含的一些特征。 ②:非线性映射层。将上一层的feature map进一步做非线性映射处理,使得网络深度加大,更有利于学到东西。 ③:网络重建层。重建用于将feature map进行还原成高分辨率图像F(Y)F(Y)F(Y),其与XXX做loss并通过反传来学习整个模型的参数。

超分算法之SRCNN(超分模型)

下面分别详细展开论述上面三个层。

特征提取层: 特征提取层用了一层的CNN以及ReLU去将图像YYY变成一堆堆向量,即feature map: F1(Y)=max(,W1⋅Y+B1).F_1(Y) = max(0, W_1\cdot Y+B_1).F1​(Y)=max(0,W1​⋅Y+B1​).其中W1、B1W_1、B_1W1​、B1​是滤波器(卷积核)的参数,这是一个f1×f1f_1\times f_1f1​×f1​大小的窗口,通道数为YYY的通道ccc,一共有n1n_1n1​个滤波器。 Note:

经过这一层,图像YYY的大小以及通道数都会发生改变。max(,x)max(0,x)max(0,x)表示ReLU层。

非线性映射层: 这一层就是将上一层的feature map再用卷积核过滤一次以及ReLU层进行激活,也可以理解为为了加深网络从而更好的学习函数F(⋅)F(\cdot)F(⋅): F2(Y)=max(,W2⋅F1(X)+B2).F_2(Y) = max(0, W_2\cdot F_1(X)+B_2).F2​(Y)=max(0,W2​⋅F1​(X)+B2​).大致结构和特征提取层一样,不一样的是这一层只是为了增加网络模型的非线性程度,所以只需采用1×11\times 11×1的卷积核就可以了,其通道数为n1n_1n1​,一共有n2n_2n2​个滤波器。当然可以继续增加非线性层,但是本文旨在推出一种通用性SR框架,所以会选择最简的网络模型。

图像重建层: 借鉴于传统超分的纯插值办法——对图像局部进行平均化的思想,其本质就是乘加结合的方式,因此作者决定采用卷积的方式(也是乘加结合的方式)去做重建: F(Y)=W3⋅F2(Y)+B3.F(Y) = W_3\cdot F_2(Y) + B_3.F(Y)=W3​⋅F2​(Y)+B3​.这一层是不需要ReLU层的,且卷积核的大小为n2×c×f3×f3n_2\times c \times f_3 \times f_3n2​×c×f3​×f3​. Note:

也可以从另一个角度来考虑,经过前面的卷积之后,图像的size变小了,因此需要上采样过程来恢复图像,势必需要一个反卷积来做这件事,而反卷积本质也是卷积的一种。3 Loss function:

设batchsize为nnn,SRCNN网络参数集为Θ={W1,W2,W3,B1,B2,B3}\Theta = \{W_1, W_2, W_3, B_1, B_2, B_3\}Θ={W1​,W2​,W3​,B1​,B2​,B3​},则Loss function可定义为: L(Θ)=1n∑i=1n∣∣F(Yi;Θ)−Xi∣∣2.L(\Theta) = \frac{1}{n}\sum^n_{i=1}||F(Y_i;\Theta) - X_i||^2.L(Θ)=n1​i=1∑n​∣∣F(Yi​;Θ)−Xi​∣∣2.Note:

选择MSE作为损失函数的一个重要原因是MSE的格式和我们图像失真评价指标PSNR很像,因此可以理解为SRCNN是直接冲着提升PSNR去的,从而让高分辨率的图像有较小的失真度。MSE就是迫使网络将我们恢复的SR图像向着Ground-Truth(标签XXX)的方向靠近。4 实验4.1 setup

实验的一些比较重要的配置如下:

Training-data涉及91张图片。Set5数据集涉及5张图片用于up-scale-factor={2,3,4}的验证与测试;Set14数据集涉及14张图片用于up-scale-factor=3的验证与测试。实验的一些参数设置:f1=9,f3=5,n1=64,n2=32f_1=9,f_3=5,n_1=64,n_2=32f1​=9,f3​=5,n1​=64,n2​=32.Ground-Truth的大小是32×3232\times 3232×32。卷积核的参数初始化来自于:wi∼N(,0.001)w_i^0\sim\mathcal{N}(0, 0.001)wi0​∼N(0,0.001)。SRCNN一共3层网络,前两层配置的学习率为1−410^{-4}10−4,最后一层的学习率配置为1−510^{-5}10−5,作者指出这种让最后一层较小的学习率有利于网络收敛。4.2 实验结果4.2.1 performance

从上图看出SRCNN的PSNR在大部分图片中都取得了最佳的值!此外,所消耗的时间也是最少的。

4.2.2 runtime

从上图可以看出SRCNN有最少的runtime!

5 进一步研究5.1 滤波器学习情况

上图是特征提取层滤波器的学习可视化图,在91张图片的训练结果,其中up-scale-factor=2。 图像a、f:类似于高斯分布。 图像b、c、d:类似于边缘检测。 图像e:类似于纹理检测。 其余:一些坏死的卷积核参数。

5.2 ImageNet学习

作者这一节旨在探究数据集的大小对performance的影响。

采用ILSVRC 2013的ImageNet数据集和91张图片这两个训练集做对比训练。在Set5数据上做测试,up-scale-factor=3。

实验结果如下: 从图中可知,大的数据集对表现力的提升是有帮助的(虽然我们都知道,但是作者还是做个实验来证明下)。

5.3 滤波器数量

作者研究滤波器数量对PSNR的提升影响,设置了3组实验,结果如下: 实验结果表明卷积核的数量对表现力是有提升的,但是数量的增加也带来了runtime的增加,如果你想获取快速的重建效果,建议还是取小数量的卷积核更好。

5.4 滤波器大小

作者研究滤波器size对PSNR的提升影响,进行了2组实验,分别是: f1=9,f3=5f_1=9,f_3=5f1​=9,f3​=5和f1=11,f3=7f_1=11,f_3=7f1​=11,f3​=7。 从实验结果来看,较大的卷积核可以提取更好的特征信息,但是也带来了runtime的上升,因此实际中我们需要根据实际情况进行trade-off。

6 效果展示

7 总结本文作为SR在深度学习领域的开篇之作,提出了一种通用性框架SRCNN,将输入图像进行Bicubic插值预处理,然后特征提取,非线性映射,最后进行重建;重建后的图像与Ground-Truth做loss来迫使网络学习到如何从LR→HRLR \to HRLR→HR的知识。选用深度学习常用的MSE作为Loss function,因为MSE与PSNR有着相似的表达式。SRCNN在PSNR和runtime上都表现不俗,超越了当时的SOAT,表征了这种框架的实用性。作者做了一系列实验,其中包括可视化乐特征提取到的向量是怎么样的;大的数据集对表现力的提升是有帮助的;卷积核的数量的增加对表现力是有提升的,但是数量的增加也带来了runtime的增加;较大的卷积核可以提取更好的特征信息,但是也带来了runtime的上升。
本文链接地址:https://www.jiuchutong.com/zhishi/288118.html 转载请保留说明!

上一篇:layui-icon各种常用动态图标(layui iconfont)

下一篇:vue中,给一个URL地址,利用FileSaver.js插件下载文件到本地(vue url 参数)

  • windows资源管理器已停止(windows资源管理器已停止)(windows资源管理器选定文件和文件夹的方式有哪些)

    windows资源管理器已停止(windows资源管理器已停止)(windows资源管理器选定文件和文件夹的方式有哪些)

  • 京东怎么查看好友的详细信息和精选晒单(京东怎么查看好友代付记录)

    京东怎么查看好友的详细信息和精选晒单(京东怎么查看好友代付记录)

  • 哔哩哔哩能下载视频吗(哔哩哔哩b站在线打开)

    哔哩哔哩能下载视频吗(哔哩哔哩b站在线打开)

  • wps文档进行密码怎么设置(wps上密码)

    wps文档进行密码怎么设置(wps上密码)

  • mate30pro有多重(华为mate30pro重多少克)

    mate30pro有多重(华为mate30pro重多少克)

  • 微信如何通过手机号转账(微信如何通过手机号找回密码)

    微信如何通过手机号转账(微信如何通过手机号找回密码)

  • 闲鱼申请退款卖家不处理会不会自动收货(闲鱼申请退款卖家还能发货吗)

    闲鱼申请退款卖家不处理会不会自动收货(闲鱼申请退款卖家还能发货吗)

  • 电脑出现应用程序错误窗口怎么办(电脑出现应用程序没有响应是怎么回事)

    电脑出现应用程序错误窗口怎么办(电脑出现应用程序没有响应是怎么回事)

  • 重新登录前部分账户服务将不可用(重新登录前部分账户服务不可用)

    重新登录前部分账户服务将不可用(重新登录前部分账户服务不可用)

  • 荣耀30有红外功能吗(荣耀30 有红外)

    荣耀30有红外功能吗(荣耀30 有红外)

  • 京东tc是什么意思(京东TC是什么意思)

    京东tc是什么意思(京东TC是什么意思)

  • wifi是全双工还是半双工(无线网络全双工)

    wifi是全双工还是半双工(无线网络全双工)

  • iphone锁屏后qq下线了(苹果手机锁屏之后qq还会在线吗)

    iphone锁屏后qq下线了(苹果手机锁屏之后qq还会在线吗)

  • 苹果手机怎么设置来电照片(苹果手机怎么设置呼叫转移功能)

    苹果手机怎么设置来电照片(苹果手机怎么设置呼叫转移功能)

  • 维码器是什么(维码器是什么软件)

    维码器是什么(维码器是什么软件)

  • 路由器ac1200什么意思(路由器的ac1200)

    路由器ac1200什么意思(路由器的ac1200)

  • r31200相当于什么i5(r31200相当于什么cpu)

    r31200相当于什么i5(r31200相当于什么cpu)

  • vivox30是全面屏吗(vivox30pro全面屏怎么设置)

    vivox30是全面屏吗(vivox30pro全面屏怎么设置)

  • ppt暂停快捷键(ppt暂停键)

    ppt暂停快捷键(ppt暂停键)

  • 全球上网是干什么用的(全球上网有什么用?)

    全球上网是干什么用的(全球上网有什么用?)

  • 探探被对方解除匹配还可能找到吗(探探被对方解除匹配发消息)

    探探被对方解除匹配还可能找到吗(探探被对方解除匹配发消息)

  • 苹果8plus128g什么时候上市(苹果8plus128g什么时候上市的)

    苹果8plus128g什么时候上市(苹果8plus128g什么时候上市的)

  • 手机qq怎么恢复空间相册(手机qq怎么恢复解散的QQ群)

    手机qq怎么恢复空间相册(手机qq怎么恢复解散的QQ群)

  • 淘宝新书拆封了可以换吗(新书拆封了还能退吗)

    淘宝新书拆封了可以换吗(新书拆封了还能退吗)

  • 如何查看最近打开的文件(如何查看最近打开的ppt)

    如何查看最近打开的文件(如何查看最近打开的ppt)

  • 小度在家299和499有什么区别(小度在家699和299区别)

    小度在家299和499有什么区别(小度在家699和299区别)

  • 怎么缩小照片内存容量(怎么缩小照片内存的应用)

    怎么缩小照片内存容量(怎么缩小照片内存的应用)

  • 阿尔法符号怎么打出来(阿尔法符号怎么打出来word)

    阿尔法符号怎么打出来(阿尔法符号怎么打出来word)

  • 美拍如何加文字(美拍怎么在视频打字)

    美拍如何加文字(美拍怎么在视频打字)

  • 如何保证企业生存发展
  • 经营活动产生的净现金流量计算公式
  • 公司向法人还回借款现金的分录
  • 销项减进项余额在哪方
  • 车辆审验费的会计分录
  • 贸易公司的印花税税率是多少
  • 短期筹资方式有没有股票
  • 机器设备如何计提折旧
  • 跨国避税
  • 投资活动购建固定资产
  • 过路费是地税还是国税
  • 北京增值税纳税申报表在哪里打印
  • 购进要不要交印花税
  • 企业装修期间开工怎么办
  • 如何调用金三接口?
  • windows10如何关闭病毒和威胁防护设置
  • 财务费用借方记负数的原因
  • 职工福利费的扣除限额怎么算
  • 外商投资企业和外资企业的区别
  • css flaot
  • vue 首页
  • php不使用内置函数的情况下,输出数组中重复最多的元素
  • 编制记账凭证出现错误
  • php模板教程
  • Vue--》Vue3打造可扩展的项目管理系统后台的完整指南(一)
  • 如何用php
  • js数组entries
  • php调用java接口
  • thinkphp钩子场景
  • 微信php开发包
  • 应收账款未计提怎么处理
  • ps如何使用套锁工具剪裁图片
  • 独资子公司与母公司
  • 计算分配本月职工工资会计分录
  • 个税查询和实发工资不符合
  • 理财利息可以计息吗
  • 网上学电脑
  • mongodb快速入门
  • 印花税怎么交税率是多少
  • 应收票据和其他应收款的区别
  • 个税赡养老人分摊方式怎么更改
  • 发票红冲操作流程
  • 个人转让著作权免征增值税判断题
  • 库存商品什么时候确认收入
  • 快递公司的会计都需要做什么
  • 建筑行业会计怎么样,有前景吗
  • 所得税预缴多了可以不退税嘛
  • 用友t3固定资产反结账的操作步骤
  • 预收物业费预收什么意思
  • 发生额怎么计算
  • 员工工资占公司收入
  • 用友t3普及版价格
  • 管理费用怎么结转到本年利润未分配利润里了
  • 工业企业成本占比多少合适
  • 企业初建
  • mysql_info
  • mysql 绿色版安装
  • w10桌面
  • mac电脑上的通讯录怎么同步到手机上
  • linux中find命令基本使用方法
  • rhel6安装
  • linux防止攻击
  • Linux httpd(apache)启动失败 解决办法
  • w7系统cf怎么调烟雾头
  • vmware centos8
  • win7系统升级win8
  • linux文件后缀名解释
  • linux 常用命令大全及其详解
  • apache for mac
  • linux如何查看磁盘信息
  • linux端口流量监控
  • win7怎么查是不是正版
  • win10怎么快一点
  • react增删改查功能
  • dota2 服务器ip地址
  • 广州地税电子税票查询
  • 佛山顺德怎么坐地铁到广州
  • 浙江省有多少家农业银行
  • 车险包括车船费吗
  • 什么是增值税税率是多少
  • 免责声明:网站部分图片文字素材来源于网络,如有侵权,请及时告知,我们会第一时间删除,谢谢! 邮箱:opceo@qq.com

    鄂ICP备2023003026号

    网站地图: 企业信息 工商信息 财税知识 网络常识 编程技术

    友情链接: 武汉网站建设