位置: IT常识 - 正文

超分算法之SRCNN(超分模型)

编辑:rootadmin
超分算法之SRCNN

推荐整理分享超分算法之SRCNN(超分模型),希望有所帮助,仅作参考,欢迎阅读内容。

文章相关热门搜索词:超分系统,超分系统,超分技术,超分算法原理,超分模型,超分技术,srcnn超分辨算法训练,srcnn超分辨算法训练,内容如对您有帮助,希望把文章链接给更多的朋友!

这篇文章是2014年的一篇论文,其主要意义在于作者推出的SRCNN是深度学习在超分上开篇之作!SRCNN证明了深度学习在超分领域的应用可以超越传统的插值等办法取得较高的表现力。

参考目录: ①深度学习图像超分辨率开山之作SRCNN(一)原理分析 ②深度学习端到端超分辨率方法发展历程

SRCNN1 SRCNN简介2 SRCNN模型结构3 Loss function:4 实验4.1 setup4.2 实验结果4.2.1 performance4.2.2 runtime5 进一步研究5.1 滤波器学习情况5.2 ImageNet学习5.3 滤波器数量5.4 滤波器大小6 效果展示7 总结1 SRCNN简介

作者推出了一种基于SISR的超分方法。这种方法基于深度学习,旨在实现一种端对端的网络模型——SRCNN,其用于将低分辨率的图像转换为高分辨图像。作者指出,SRCNN在当时的数据集下达到了SOAT的水平。

SRCNN具有结构简单且低失真度的特点:如上图所示,只需要一定的训练回合,SRCNN就可以超过传统的超分方法。

在一定数量的卷积层结构下,SRCNN可以达到fast-training。

实验表明,在一定范围内,越大的数据集和较大的网络模型可以提升SRCNN对图像的重建效果。

2 SRCNN模型结构

首先说明以下符号的含义:

YYY:输入图像经过预处理(双三次插值)得到的图像,我们仍将YYY当作是低分辨率图像,但它的size要比输入图像要大。F(Y)F(Y)F(Y):网络最后输出的图像,我们的目标就是通过优化F(Y)F(Y)F(Y)和Ground-Truth之间的loss来学会这个函数F(⋅)F(\cdot)F(⋅)。XXX:高分辨率图像,即Ground-Truth,它和YYY的size是相同的。

如上图所示是SRCNN的网络模型,其分为三部分,分别是: ①:Patch extraction and representation(其实就是图像特征提取层)。通过CNN将图像YYY的特征提取出来存到向量中,这个向量里包含了多张feature map,即一张图所含的一些特征。 ②:非线性映射层。将上一层的feature map进一步做非线性映射处理,使得网络深度加大,更有利于学到东西。 ③:网络重建层。重建用于将feature map进行还原成高分辨率图像F(Y)F(Y)F(Y),其与XXX做loss并通过反传来学习整个模型的参数。

超分算法之SRCNN(超分模型)

下面分别详细展开论述上面三个层。

特征提取层: 特征提取层用了一层的CNN以及ReLU去将图像YYY变成一堆堆向量,即feature map: F1(Y)=max(,W1⋅Y+B1).F_1(Y) = max(0, W_1\cdot Y+B_1).F1​(Y)=max(0,W1​⋅Y+B1​).其中W1、B1W_1、B_1W1​、B1​是滤波器(卷积核)的参数,这是一个f1×f1f_1\times f_1f1​×f1​大小的窗口,通道数为YYY的通道ccc,一共有n1n_1n1​个滤波器。 Note:

经过这一层,图像YYY的大小以及通道数都会发生改变。max(,x)max(0,x)max(0,x)表示ReLU层。

非线性映射层: 这一层就是将上一层的feature map再用卷积核过滤一次以及ReLU层进行激活,也可以理解为为了加深网络从而更好的学习函数F(⋅)F(\cdot)F(⋅): F2(Y)=max(,W2⋅F1(X)+B2).F_2(Y) = max(0, W_2\cdot F_1(X)+B_2).F2​(Y)=max(0,W2​⋅F1​(X)+B2​).大致结构和特征提取层一样,不一样的是这一层只是为了增加网络模型的非线性程度,所以只需采用1×11\times 11×1的卷积核就可以了,其通道数为n1n_1n1​,一共有n2n_2n2​个滤波器。当然可以继续增加非线性层,但是本文旨在推出一种通用性SR框架,所以会选择最简的网络模型。

图像重建层: 借鉴于传统超分的纯插值办法——对图像局部进行平均化的思想,其本质就是乘加结合的方式,因此作者决定采用卷积的方式(也是乘加结合的方式)去做重建: F(Y)=W3⋅F2(Y)+B3.F(Y) = W_3\cdot F_2(Y) + B_3.F(Y)=W3​⋅F2​(Y)+B3​.这一层是不需要ReLU层的,且卷积核的大小为n2×c×f3×f3n_2\times c \times f_3 \times f_3n2​×c×f3​×f3​. Note:

也可以从另一个角度来考虑,经过前面的卷积之后,图像的size变小了,因此需要上采样过程来恢复图像,势必需要一个反卷积来做这件事,而反卷积本质也是卷积的一种。3 Loss function:

设batchsize为nnn,SRCNN网络参数集为Θ={W1,W2,W3,B1,B2,B3}\Theta = \{W_1, W_2, W_3, B_1, B_2, B_3\}Θ={W1​,W2​,W3​,B1​,B2​,B3​},则Loss function可定义为: L(Θ)=1n∑i=1n∣∣F(Yi;Θ)−Xi∣∣2.L(\Theta) = \frac{1}{n}\sum^n_{i=1}||F(Y_i;\Theta) - X_i||^2.L(Θ)=n1​i=1∑n​∣∣F(Yi​;Θ)−Xi​∣∣2.Note:

选择MSE作为损失函数的一个重要原因是MSE的格式和我们图像失真评价指标PSNR很像,因此可以理解为SRCNN是直接冲着提升PSNR去的,从而让高分辨率的图像有较小的失真度。MSE就是迫使网络将我们恢复的SR图像向着Ground-Truth(标签XXX)的方向靠近。4 实验4.1 setup

实验的一些比较重要的配置如下:

Training-data涉及91张图片。Set5数据集涉及5张图片用于up-scale-factor={2,3,4}的验证与测试;Set14数据集涉及14张图片用于up-scale-factor=3的验证与测试。实验的一些参数设置:f1=9,f3=5,n1=64,n2=32f_1=9,f_3=5,n_1=64,n_2=32f1​=9,f3​=5,n1​=64,n2​=32.Ground-Truth的大小是32×3232\times 3232×32。卷积核的参数初始化来自于:wi∼N(,0.001)w_i^0\sim\mathcal{N}(0, 0.001)wi0​∼N(0,0.001)。SRCNN一共3层网络,前两层配置的学习率为1−410^{-4}10−4,最后一层的学习率配置为1−510^{-5}10−5,作者指出这种让最后一层较小的学习率有利于网络收敛。4.2 实验结果4.2.1 performance

从上图看出SRCNN的PSNR在大部分图片中都取得了最佳的值!此外,所消耗的时间也是最少的。

4.2.2 runtime

从上图可以看出SRCNN有最少的runtime!

5 进一步研究5.1 滤波器学习情况

上图是特征提取层滤波器的学习可视化图,在91张图片的训练结果,其中up-scale-factor=2。 图像a、f:类似于高斯分布。 图像b、c、d:类似于边缘检测。 图像e:类似于纹理检测。 其余:一些坏死的卷积核参数。

5.2 ImageNet学习

作者这一节旨在探究数据集的大小对performance的影响。

采用ILSVRC 2013的ImageNet数据集和91张图片这两个训练集做对比训练。在Set5数据上做测试,up-scale-factor=3。

实验结果如下: 从图中可知,大的数据集对表现力的提升是有帮助的(虽然我们都知道,但是作者还是做个实验来证明下)。

5.3 滤波器数量

作者研究滤波器数量对PSNR的提升影响,设置了3组实验,结果如下: 实验结果表明卷积核的数量对表现力是有提升的,但是数量的增加也带来了runtime的增加,如果你想获取快速的重建效果,建议还是取小数量的卷积核更好。

5.4 滤波器大小

作者研究滤波器size对PSNR的提升影响,进行了2组实验,分别是: f1=9,f3=5f_1=9,f_3=5f1​=9,f3​=5和f1=11,f3=7f_1=11,f_3=7f1​=11,f3​=7。 从实验结果来看,较大的卷积核可以提取更好的特征信息,但是也带来了runtime的上升,因此实际中我们需要根据实际情况进行trade-off。

6 效果展示

7 总结本文作为SR在深度学习领域的开篇之作,提出了一种通用性框架SRCNN,将输入图像进行Bicubic插值预处理,然后特征提取,非线性映射,最后进行重建;重建后的图像与Ground-Truth做loss来迫使网络学习到如何从LR→HRLR \to HRLR→HR的知识。选用深度学习常用的MSE作为Loss function,因为MSE与PSNR有着相似的表达式。SRCNN在PSNR和runtime上都表现不俗,超越了当时的SOAT,表征了这种框架的实用性。作者做了一系列实验,其中包括可视化乐特征提取到的向量是怎么样的;大的数据集对表现力的提升是有帮助的;卷积核的数量的增加对表现力是有提升的,但是数量的增加也带来了runtime的增加;较大的卷积核可以提取更好的特征信息,但是也带来了runtime的上升。
本文链接地址:https://www.jiuchutong.com/zhishi/288118.html 转载请保留说明!

上一篇:layui-icon各种常用动态图标(layui iconfont)

下一篇:vue中,给一个URL地址,利用FileSaver.js插件下载文件到本地(vue url 参数)

  • excel如何去重复项(excel如何去重复项然后把重复项数值相加)

    excel如何去重复项(excel如何去重复项然后把重复项数值相加)

  • vivox50是5G手机吗(vivox50是5g网络吗)

    vivox50是5G手机吗(vivox50是5g网络吗)

  • 物联卡网速慢(物联卡网速慢怎么解决)

    物联卡网速慢(物联卡网速慢怎么解决)

  • 微信如何认定恶意营销(微信怎样会被判定为恶意营销)

    微信如何认定恶意营销(微信怎样会被判定为恶意营销)

  • 闲鱼买家故意拒收可以不退吗(闲鱼买家故意拒绝签收)

    闲鱼买家故意拒收可以不退吗(闲鱼买家故意拒绝签收)

  • 华为free3防摔吗(华为freebuds3i防水吗)

    华为free3防摔吗(华为freebuds3i防水吗)

  • 宽带机顶盒los亮红灯怎么回事(机顶盒los一直闪红灯)

    宽带机顶盒los亮红灯怎么回事(机顶盒los一直闪红灯)

  • 苹果拍照怎么才能不反(苹果拍照怎么才能没声音)

    苹果拍照怎么才能不反(苹果拍照怎么才能没声音)

  • 热门时要不要连续发作品

    热门时要不要连续发作品

  • 苹果手机的安全中心在哪里(苹果手机的安全性高吗)

    苹果手机的安全中心在哪里(苹果手机的安全性高吗)

  • 我的手机是什么型号(我的手机是什么型号的怎么查)

    我的手机是什么型号(我的手机是什么型号的怎么查)

  • 电话轰炸怎么办(电话怎么轰炸别人)

    电话轰炸怎么办(电话怎么轰炸别人)

  • 小米手环4续航能力(小米手环4续航不足一天)

    小米手环4续航能力(小米手环4续航不足一天)

  • 微信位置共享能说话吗(微信位置共享能改吗)

    微信位置共享能说话吗(微信位置共享能改吗)

  • 打别人电话老是通话中(打别人电话老是转语音)

    打别人电话老是通话中(打别人电话老是转语音)

  • 怎么拒接所有陌生电话(怎么拒接所有陌生号码来电OPPO)

    怎么拒接所有陌生电话(怎么拒接所有陌生号码来电OPPO)

  • 显卡super什么意思(super显卡跟一般的显卡区别)

    显卡super什么意思(super显卡跟一般的显卡区别)

  • iOS来电阻止怎么开(苹果来电阻止怎么设置在哪)

    iOS来电阻止怎么开(苹果来电阻止怎么设置在哪)

  • 手机交易码是什么(手机交易码是什么在哪里查看)

    手机交易码是什么(手机交易码是什么在哪里查看)

  • 乐猫智服有支付牌照吗(乐猫智服怎么帮你代还)

    乐猫智服有支付牌照吗(乐猫智服怎么帮你代还)

  • 微信动态视频怎么会在群里显示(微信动态视频怎么拍)

    微信动态视频怎么会在群里显示(微信动态视频怎么拍)

  • 网络安全攻击的主要表现(网络安全攻击的四种形式)

    网络安全攻击的主要表现(网络安全攻击的四种形式)

  • qq怎样恢复被删除的好友(qq怎样恢复删除的聊天记录)

    qq怎样恢复被删除的好友(qq怎样恢复删除的聊天记录)

  • 小米9充满电要多久(小米9充满电多久)

    小米9充满电要多久(小米9充满电多久)

  • 如何修改MacOS默认输入法?修改MacOS默认输入法的方法(macbook怎么修改默认系统)

    如何修改MacOS默认输入法?修改MacOS默认输入法的方法(macbook怎么修改默认系统)

  • uniapp input框校验数据格式,只能输入汉字/数字/字母等(uniapp获取input的值)

    uniapp input框校验数据格式,只能输入汉字/数字/字母等(uniapp获取input的值)

  • 【工作流Activiti7】3、Activiti7 回退与会签(工作流activity)

    【工作流Activiti7】3、Activiti7 回退与会签(工作流activity)

  • dedecms织梦自动给图片添加alt属性(织梦如何添加浮动广告)

    dedecms织梦自动给图片添加alt属性(织梦如何添加浮动广告)

  • 不含税价格计算方法
  • 小规模纳税人起征点和免征额
  • 减免税款递延收入怎么算
  • 安全生产费实际发生必须是付款吗还是挂帐也可以
  • 主营业务成本的数据从哪里来的
  • 什么叫备品备件
  • 怎么快速金蝶数据入库
  • 民办幼儿园的税收是多少
  • 工会经费2019年新政策
  • 可以向国外账户汇人民币吗
  • 房产折旧计算方法 举例
  • 地税保险单位编号是什么
  • 中国公司投资海外有什么限制
  • 小规模商贸公司成本核算方法
  • 工程税票怎么开需要交多少
  • 发票在验旧日期之后作废吗
  • 异地项目预缴个人所得税
  • 闲置资金购买理财产品
  • 发票跨期审计调查报告
  • 现金支付奖金
  • 固定资产转入清理记账凭证
  • 安装额外语言
  • 如何禁用开始目录的app自动推荐
  • 实收资本可以大于注册资本吗
  • 发票明细与实际送货清单不符
  • scrtkfg.exe - scrtkfg是什么进程 有什么用
  • 价外费用分录
  • 海月水母有性别吗
  • echarts图表绘制步骤
  • EMQX(MQTT)----基本用法以及使用Python程序进行模拟流程
  • 简易计税办法和计税依据
  • 100行php代码实现加密端口转发
  • vuex详解和用法
  • laravel入门与实战:构建主流php应用开发框架
  • php框架基础教程
  • 收到退回残保金怎么做账
  • 锁定vlookup快捷键
  • 解决什么情况
  • 生产企业出口退税账务处理会计分录
  • 发票明细清单怎么打印
  • 帝国cms模板文件放在哪里
  • mongodb数据库中使用哪个数据库可以设置用户名和密码
  • 外贸企业主要做什么
  • 非货币性资产交换以公允价值为基础进行计量
  • 增值税进项发票勾选认证流程
  • 小规模公司的做账要求
  • 无法连接配置的sql服务器
  • mysql 查找语句
  • 收据上面盖公章有用吗
  • var文件是什么意思
  • 未税金额怎么算税费
  • 固定资产采购需要走什么流程
  • 投资性房地产账面价值大于公允价值计入什么
  • 废料卖出算哪种收入
  • 设置出纳权限的操作步骤
  • win7系统开启无线服务
  • linux系统软件包安装
  • windows10 uac关闭
  • win7系统禁用网络后如何开启
  • win8.1开始菜单怎么改成win7那样
  • cocos2d-x教程
  • jquery自定义组件
  • 猫的游戏解说
  • ztree getnodebytid
  • 安卓关键词覆盖
  • jquery popupDialog 使用 加载jsp页面的方法
  • Android百度地图定位 sdk 地理围栏监听
  • 安卓模拟器错误怎么办
  • js代码示例
  • jquery取消单选框选中
  • js设置图片边框
  • jquery使用Cookie和JSON记录用户最近浏览历史
  • 税控盘登录密码忘了怎么办怎么重置
  • 施工企业应缴纳的税金计算
  • 贷款利息收入增值税税率2023
  • 小规模纳税人改成一般纳税人怎么改
  • 注册会计师和注册审计师哪个厉害
  • 北京市延庆区城管执法局
  • 矿产资源税税率2020年
  • 江苏个人扣税
  • 免责声明:网站部分图片文字素材来源于网络,如有侵权,请及时告知,我们会第一时间删除,谢谢! 邮箱:opceo@qq.com

    鄂ICP备2023003026号

    网站地图: 企业信息 工商信息 财税知识 网络常识 编程技术

    友情链接: 武汉网站建设