位置: IT常识 - 正文

超分算法之SRCNN(超分模型)

编辑:rootadmin
超分算法之SRCNN

推荐整理分享超分算法之SRCNN(超分模型),希望有所帮助,仅作参考,欢迎阅读内容。

文章相关热门搜索词:超分系统,超分系统,超分技术,超分算法原理,超分模型,超分技术,srcnn超分辨算法训练,srcnn超分辨算法训练,内容如对您有帮助,希望把文章链接给更多的朋友!

这篇文章是2014年的一篇论文,其主要意义在于作者推出的SRCNN是深度学习在超分上开篇之作!SRCNN证明了深度学习在超分领域的应用可以超越传统的插值等办法取得较高的表现力。

参考目录: ①深度学习图像超分辨率开山之作SRCNN(一)原理分析 ②深度学习端到端超分辨率方法发展历程

SRCNN1 SRCNN简介2 SRCNN模型结构3 Loss function:4 实验4.1 setup4.2 实验结果4.2.1 performance4.2.2 runtime5 进一步研究5.1 滤波器学习情况5.2 ImageNet学习5.3 滤波器数量5.4 滤波器大小6 效果展示7 总结1 SRCNN简介

作者推出了一种基于SISR的超分方法。这种方法基于深度学习,旨在实现一种端对端的网络模型——SRCNN,其用于将低分辨率的图像转换为高分辨图像。作者指出,SRCNN在当时的数据集下达到了SOAT的水平。

SRCNN具有结构简单且低失真度的特点:如上图所示,只需要一定的训练回合,SRCNN就可以超过传统的超分方法。

在一定数量的卷积层结构下,SRCNN可以达到fast-training。

实验表明,在一定范围内,越大的数据集和较大的网络模型可以提升SRCNN对图像的重建效果。

2 SRCNN模型结构

首先说明以下符号的含义:

YYY:输入图像经过预处理(双三次插值)得到的图像,我们仍将YYY当作是低分辨率图像,但它的size要比输入图像要大。F(Y)F(Y)F(Y):网络最后输出的图像,我们的目标就是通过优化F(Y)F(Y)F(Y)和Ground-Truth之间的loss来学会这个函数F(⋅)F(\cdot)F(⋅)。XXX:高分辨率图像,即Ground-Truth,它和YYY的size是相同的。

如上图所示是SRCNN的网络模型,其分为三部分,分别是: ①:Patch extraction and representation(其实就是图像特征提取层)。通过CNN将图像YYY的特征提取出来存到向量中,这个向量里包含了多张feature map,即一张图所含的一些特征。 ②:非线性映射层。将上一层的feature map进一步做非线性映射处理,使得网络深度加大,更有利于学到东西。 ③:网络重建层。重建用于将feature map进行还原成高分辨率图像F(Y)F(Y)F(Y),其与XXX做loss并通过反传来学习整个模型的参数。

超分算法之SRCNN(超分模型)

下面分别详细展开论述上面三个层。

特征提取层: 特征提取层用了一层的CNN以及ReLU去将图像YYY变成一堆堆向量,即feature map: F1(Y)=max(,W1⋅Y+B1).F_1(Y) = max(0, W_1\cdot Y+B_1).F1​(Y)=max(0,W1​⋅Y+B1​).其中W1、B1W_1、B_1W1​、B1​是滤波器(卷积核)的参数,这是一个f1×f1f_1\times f_1f1​×f1​大小的窗口,通道数为YYY的通道ccc,一共有n1n_1n1​个滤波器。 Note:

经过这一层,图像YYY的大小以及通道数都会发生改变。max(,x)max(0,x)max(0,x)表示ReLU层。

非线性映射层: 这一层就是将上一层的feature map再用卷积核过滤一次以及ReLU层进行激活,也可以理解为为了加深网络从而更好的学习函数F(⋅)F(\cdot)F(⋅): F2(Y)=max(,W2⋅F1(X)+B2).F_2(Y) = max(0, W_2\cdot F_1(X)+B_2).F2​(Y)=max(0,W2​⋅F1​(X)+B2​).大致结构和特征提取层一样,不一样的是这一层只是为了增加网络模型的非线性程度,所以只需采用1×11\times 11×1的卷积核就可以了,其通道数为n1n_1n1​,一共有n2n_2n2​个滤波器。当然可以继续增加非线性层,但是本文旨在推出一种通用性SR框架,所以会选择最简的网络模型。

图像重建层: 借鉴于传统超分的纯插值办法——对图像局部进行平均化的思想,其本质就是乘加结合的方式,因此作者决定采用卷积的方式(也是乘加结合的方式)去做重建: F(Y)=W3⋅F2(Y)+B3.F(Y) = W_3\cdot F_2(Y) + B_3.F(Y)=W3​⋅F2​(Y)+B3​.这一层是不需要ReLU层的,且卷积核的大小为n2×c×f3×f3n_2\times c \times f_3 \times f_3n2​×c×f3​×f3​. Note:

也可以从另一个角度来考虑,经过前面的卷积之后,图像的size变小了,因此需要上采样过程来恢复图像,势必需要一个反卷积来做这件事,而反卷积本质也是卷积的一种。3 Loss function:

设batchsize为nnn,SRCNN网络参数集为Θ={W1,W2,W3,B1,B2,B3}\Theta = \{W_1, W_2, W_3, B_1, B_2, B_3\}Θ={W1​,W2​,W3​,B1​,B2​,B3​},则Loss function可定义为: L(Θ)=1n∑i=1n∣∣F(Yi;Θ)−Xi∣∣2.L(\Theta) = \frac{1}{n}\sum^n_{i=1}||F(Y_i;\Theta) - X_i||^2.L(Θ)=n1​i=1∑n​∣∣F(Yi​;Θ)−Xi​∣∣2.Note:

选择MSE作为损失函数的一个重要原因是MSE的格式和我们图像失真评价指标PSNR很像,因此可以理解为SRCNN是直接冲着提升PSNR去的,从而让高分辨率的图像有较小的失真度。MSE就是迫使网络将我们恢复的SR图像向着Ground-Truth(标签XXX)的方向靠近。4 实验4.1 setup

实验的一些比较重要的配置如下:

Training-data涉及91张图片。Set5数据集涉及5张图片用于up-scale-factor={2,3,4}的验证与测试;Set14数据集涉及14张图片用于up-scale-factor=3的验证与测试。实验的一些参数设置:f1=9,f3=5,n1=64,n2=32f_1=9,f_3=5,n_1=64,n_2=32f1​=9,f3​=5,n1​=64,n2​=32.Ground-Truth的大小是32×3232\times 3232×32。卷积核的参数初始化来自于:wi∼N(,0.001)w_i^0\sim\mathcal{N}(0, 0.001)wi0​∼N(0,0.001)。SRCNN一共3层网络,前两层配置的学习率为1−410^{-4}10−4,最后一层的学习率配置为1−510^{-5}10−5,作者指出这种让最后一层较小的学习率有利于网络收敛。4.2 实验结果4.2.1 performance

从上图看出SRCNN的PSNR在大部分图片中都取得了最佳的值!此外,所消耗的时间也是最少的。

4.2.2 runtime

从上图可以看出SRCNN有最少的runtime!

5 进一步研究5.1 滤波器学习情况

上图是特征提取层滤波器的学习可视化图,在91张图片的训练结果,其中up-scale-factor=2。 图像a、f:类似于高斯分布。 图像b、c、d:类似于边缘检测。 图像e:类似于纹理检测。 其余:一些坏死的卷积核参数。

5.2 ImageNet学习

作者这一节旨在探究数据集的大小对performance的影响。

采用ILSVRC 2013的ImageNet数据集和91张图片这两个训练集做对比训练。在Set5数据上做测试,up-scale-factor=3。

实验结果如下: 从图中可知,大的数据集对表现力的提升是有帮助的(虽然我们都知道,但是作者还是做个实验来证明下)。

5.3 滤波器数量

作者研究滤波器数量对PSNR的提升影响,设置了3组实验,结果如下: 实验结果表明卷积核的数量对表现力是有提升的,但是数量的增加也带来了runtime的增加,如果你想获取快速的重建效果,建议还是取小数量的卷积核更好。

5.4 滤波器大小

作者研究滤波器size对PSNR的提升影响,进行了2组实验,分别是: f1=9,f3=5f_1=9,f_3=5f1​=9,f3​=5和f1=11,f3=7f_1=11,f_3=7f1​=11,f3​=7。 从实验结果来看,较大的卷积核可以提取更好的特征信息,但是也带来了runtime的上升,因此实际中我们需要根据实际情况进行trade-off。

6 效果展示

7 总结本文作为SR在深度学习领域的开篇之作,提出了一种通用性框架SRCNN,将输入图像进行Bicubic插值预处理,然后特征提取,非线性映射,最后进行重建;重建后的图像与Ground-Truth做loss来迫使网络学习到如何从LR→HRLR \to HRLR→HR的知识。选用深度学习常用的MSE作为Loss function,因为MSE与PSNR有着相似的表达式。SRCNN在PSNR和runtime上都表现不俗,超越了当时的SOAT,表征了这种框架的实用性。作者做了一系列实验,其中包括可视化乐特征提取到的向量是怎么样的;大的数据集对表现力的提升是有帮助的;卷积核的数量的增加对表现力是有提升的,但是数量的增加也带来了runtime的增加;较大的卷积核可以提取更好的特征信息,但是也带来了runtime的上升。
本文链接地址:https://www.jiuchutong.com/zhishi/288118.html 转载请保留说明!

上一篇:layui-icon各种常用动态图标(layui iconfont)

下一篇:vue中,给一个URL地址,利用FileSaver.js插件下载文件到本地(vue url 参数)

  • 死耗子鼓起人生自信(死耗子长什么样子)

    死耗子鼓起人生自信(死耗子长什么样子)

  • 钉钉怎样将家长身份改为学生(钉钉怎样将家长身份改为老师)

    钉钉怎样将家长身份改为学生(钉钉怎样将家长身份改为老师)

  • 快手可以查一年的购物记录吗(快手怎么查一年前的账单)

    快手可以查一年的购物记录吗(快手怎么查一年前的账单)

  • 驱动程序无法使用怎么办(驱动程序无法使用但是能打印)

    驱动程序无法使用怎么办(驱动程序无法使用但是能打印)

  • 解锁bl是什么(解锁bl有什么影响)

    解锁bl是什么(解锁bl有什么影响)

  • 户户通m11位置锁定模块异常(户户通m11位置锁定模块异常已解决怎么那个图片还在)

    户户通m11位置锁定模块异常(户户通m11位置锁定模块异常已解决怎么那个图片还在)

  • 华硕电脑充电一直是0(华硕电脑充电一充一停)

    华硕电脑充电一直是0(华硕电脑充电一充一停)

  • qq上一起听歌怎么弄(QQ上一起听歌怎么换歌)

    qq上一起听歌怎么弄(QQ上一起听歌怎么换歌)

  • 抖音没18可以直播吗(抖音不满18岁可以直播吗)

    抖音没18可以直播吗(抖音不满18岁可以直播吗)

  • 苹果有锁无锁什么意思(苹果有锁无锁什么区别)

    苹果有锁无锁什么意思(苹果有锁无锁什么区别)

  • 微信能申请几个号(微信能申请几个微信号)

    微信能申请几个号(微信能申请几个微信号)

  • 苹果未激活什么意思(iphone未激活的是新机吗)

    苹果未激活什么意思(iphone未激活的是新机吗)

  • 微信运动数据不更新的原因(微信运动数据不准确怎么调整)

    微信运动数据不更新的原因(微信运动数据不准确怎么调整)

  • 小米平板4黑屏假死(小米平板4黑屏有背光)

    小米平板4黑屏假死(小米平板4黑屏有背光)

  • 手机qq自动回复太多了怎么删除几个(手机qq自动回复在哪里设置)

    手机qq自动回复太多了怎么删除几个(手机qq自动回复在哪里设置)

  • 华为的英文标志是什么(华为的英文标志图片)

    华为的英文标志是什么(华为的英文标志图片)

  • 手机怎么省电(手机怎么省电模式)

    手机怎么省电(手机怎么省电模式)

  • 华为mate20支持视频来电吗

    华为mate20支持视频来电吗

  • 华为mate30pro怎么插卡(华为mate30pro怎么刷机)

    华为mate30pro怎么插卡(华为mate30pro怎么刷机)

  • 移动全网通什么意思(移动全网通手机)

    移动全网通什么意思(移动全网通手机)

  • 微博怎么发长文(微博怎么发长文字)

    微博怎么发长文(微博怎么发长文字)

  • 怎么看淘金币多久过期(怎么看淘金币多还是少)

    怎么看淘金币多久过期(怎么看淘金币多还是少)

  • HTML+CSS+JavaScript仿京东购物商城网站 web前端制作服装购物商城 html电商购物网站

    HTML+CSS+JavaScript仿京东购物商城网站 web前端制作服装购物商城 html电商购物网站

  • 【ChatGPT】AI 发展如此火热,程序员的发展呢?(发ai的英文单词)

    【ChatGPT】AI 发展如此火热,程序员的发展呢?(发ai的英文单词)

  • 捐赠免税会计分录
  • 电子设备租赁费专票税率
  • 如何确定合伙企业
  • 什么是企业的命脉
  • 工程预付款的支付要求
  • 增值税包括哪些内容
  • 小规模企业所得税优惠政策最新2023
  • 工会经费计入成本费用
  • 进项税额结转不结转
  • 租金没有发票可以入账吗
  • 企业季度预缴所得税怎么账务处理
  • 固定资产造成的损失可以税前扣除吗
  • 预交增值税怎么入账
  • 税控盘年费去哪里交
  • 出口退税注销备注怎么填
  • 企业哪些可以抵扣增值税
  • 外经证预交增值税和专管员
  • 保洁劳务税点
  • 消费税组成计税价格成本利润率
  • 三板市场前世今生
  • 所得税退费怎么操作
  • 包销和代销哪个风险大
  • 工资年终奖金扣多少税
  • 车辆购置税退税条件
  • 利息支出为什么不是经营成本
  • 安全库存的三种算法
  • 企业帐薄包括哪些
  • 劳务费没发票怎样下账
  • php session实例
  • 不良修复体的危害
  • 年末进公司有年终奖吗
  • 法定假日的加班费怎么算
  • 进项税可以留底多长时间
  • input输入框限制输入数字范围
  • vue.js前端
  • 发票网上平台勾选流程
  • php操作mysql数据库
  • 资产负债表各项目年初余额栏内各项数字
  • 递归最小二乘法辨识参数
  • php for break
  • 小规模纳税人按简易计税法计税时也可以进行税额的抵扣
  • 固定资产一次性扣除政策
  • access创建一个表
  • 建筑总承包分包单位可以是市政总承包吗
  • 计提和结转的例子
  • 现代服务税目包括哪些具体分类
  • 采用汇兑的方式归还前欠货款
  • 什么叫生活补助
  • 增值税专用发票几个点
  • 低值易耗品怎么摊
  • 税务局收款收据
  • 公司与公司之间的函怎么写
  • 企业为职工购买互助保障项目经费可以有什么开支
  • windows10关闭usb端口
  • 怎么用uefi装win7
  • 任务管理器边框怎么设置
  • mac adobe flash player一直提示更新
  • ie10怎么设置ie8兼容模式
  • windows defender 图标怎么从任务栏删除
  • 怎样修改mac
  • win7重新安装windows
  • 电脑主板驱动
  • 电脑预装软件是什么意思
  • 安卓骰子游戏
  • 批处理命令在windows操作中的典型应用
  • python递归函数详解
  • java怎样学
  • NGUI 响应touchscript 的 tuio动作
  • 打造自己的庭院花园游戏
  • 猫的喵喵
  • nodejs图片上传
  • 纳税申报表如何打印
  • 土地闲置是否需要缴纳土地使用税
  • 甘肃国税电子税务局
  • 重庆税务信息采集如何操作
  • 重庆市电费网上查询
  • 税控盘怎么看收入
  • 自建房交契税需要什么
  • 企业将持有的交易性金融资产售出,实际收到出售价款
  • 江苏省国税局局长
  • 免责声明:网站部分图片文字素材来源于网络,如有侵权,请及时告知,我们会第一时间删除,谢谢! 邮箱:opceo@qq.com

    鄂ICP备2023003026号

    网站地图: 企业信息 工商信息 财税知识 网络常识 编程技术

    友情链接: 武汉网站建设