位置: IT常识 - 正文

U-Net介绍(u-net优点)

编辑:rootadmin
U-Net介绍

推荐整理分享U-Net介绍(u-net优点),希望有所帮助,仅作参考,欢迎阅读内容。

文章相关热门搜索词:u–net,u-net优点,u-net结构,u network,u-net transformer,u-net transformer,u-net网络,unet介绍,内容如对您有帮助,希望把文章链接给更多的朋友!

Unet 发表于 2015 年,属于 FCN 的一种变体。Unet 的初衷是为了解决生物医学图像的问题,由于效果确实很好后来也被广泛的应用在语义分割的各个方向,如卫星图像分割,工业瑕疵检测等。

Unet 跟 FCN 都是 Encoder-Decoder 结构,结构简单但很有效。

Encoder 负责特征提取,可以将各种特征提取网络放在这个位置。Decoder 恢复原始分辨率,该过程比较关键的步骤就是 upsampling 与 skip-connection。

 Unet主要可分为三部分来看分别为左(特征提取),中(拼接),右(上采样)

特征提取部分:它是一个收缩网络,通过四个下采样,使图片尺寸减小,在这不断下采样的过程中,特征提取到的是浅层信息。具体过程是,输入图片然后经过两个卷积核(3x3后面紧跟着一个Relu)以论文原图为例:输入572x572,经过两个卷积核(大小为3x3)大小从572-570-568,然后经过一个Maxpool(2x2)图片尺寸变为284这即为一个完整的下采样,接下来三个也是如此。在下采样的过程中,通道数翻倍,例如图上的从64-128。copy and crop拼接:在UNet有四个拼接操作。有人也叫Skip connect,目的是融合特征信息,使深层和浅层的信息融合起来,在拼接的时候要注意,不仅图片大小要一致,特征的维度(channels)也要一样,才可以拼接。上采样部分 up-conv,也叫扩张网络,图片尺寸变大,提取的是深层信息,使用了四个上采样,在上采样的过程中,图片的通道数是减半的,与左部分的特征提取通道数的变化相反。在上采样的过程融合了左边的浅层的信息即拼接了左边的特征。

Upsampling 上采样常用的方式有两种:1.FCN 中介绍的反卷积;2. 插值。

1、反卷积:

①卷积后,结果图像比原图小:称之为valid卷积

②卷积后,结果图像与原图大小相同:称之为same卷积

③卷积后,结果图像比原图大:称之为full卷积

U-Net介绍(u-net优点)

其中,full卷积其实就是反卷积的过程。到这里应该可以意识到,反卷积实际上也是一种特殊的卷积方式,它可以通过full卷积将原图扩大,增大原图的分辨率,所以对图像进行反卷积也称为对图像进行“上采样”。因此,也可以很直接地理解到,图像的卷积和反卷积并不是一个简单的变换、还原过程,也就是先把图片进行卷积,再用同样的卷积核进行反卷积,是不能还原成原图的,因为反卷积后只是单纯地对图片进行扩大处理,并不能还原成原图像。图4所展示的例子可以很好地说明这一现象:

         图  卷积(上)与反卷积(下)

  由图可见,蓝色是3×3的卷积核,在原图进行卷积和反卷积后,最后得到的图像跟原图是不一致的。因此,通过反卷积并不能还原卷积之前的矩阵,只能从大小上进行还原,因为反卷积的本质还是卷积。如果想要还原成原图像,只能通过专门设计不同的卷积核来实现。

2、插值:bilinear 双线性插值的综合表现较好也较为常见 。双线性插值的计算过程没有需要学习的参数,实际就是套公式。

[补充]1、U-Net数据输入

由于在不断valid卷积过程中,会使得图片越来越小,为了避免数据丢失,在图像输入前都需要进行镜像扩大,如图所示:

可以看到图像在输入前,四个边都进行了镜像扩大操作,以保证在通过一系列的valid卷积操作之后的结果能够与原图大小相一致。由于有些计算机的内存较小,无法直接对整张图片进行处理(医学图像通常都很大),会采取把大图进行分块输入的训练方式,最后将结果一块块拼起来。为了避免在拼接过程中边缘部分出现不连接等问题,在训练前,每一小块都会选择镜像扩大而不是直接补0扩大,以保留更多边缘附近的信息。 2、卷积核中的数值如何确定?

权值的确定一般都是经过“初始化→根据训练结果逐步调整→训练精度达到目标后停止调整→确定权值”这样一个过程,因此U-net卷积核中数值的确定过程也是类似的,一开始也是先用随机数(服从高斯分布)进行初始化,后面则根据前面提到的损失函数逐步对数值进行调整,当训练精度符合要求后停止,即能确定每个卷积核中的数值(即权值)。

而调整卷积核数值的过程,实际上就是U-net的训练过程,当卷积核结束训练确定数值后,则U-net训练完成。

3、U-net训练深度如何确定?

这跟全连接神经网络中“神经网络层数如何确定”这样一个问题是类似的,目前也没有一个专门的标准,一般根据经验选取,或设置多种不同的深度,通过训练效果来选择最优的层数。U-net原文中也没有提到为什么要选择4层,可能是在该训练项目中,4层的分割效果最好。

4、如何解决U-net训练样本少的问题?

医学影像数据存在一个共同的特点,就是样本量一般较少,当训练样本过少时,容易使得训练效果不佳。解决该问题的方法是数据增强,数据增强可以在训练样本较少时,也能够让神经网络学习到更多的数据特征,不同的训练任务,数据增强的方法也不尽相同。由于U-net文章中的任务是分割Hela细胞,作者选择了弹性变换的方式进行数据增强,如图所示:

弹性变换其实就是把原图进行不同的弹性扭曲,形成新的图片,扩大样本量,由于这种弹性变化在细胞中是十分常见的,人为增加这种数据量能够让U-net学习到这种形变的不变性,当遇到新的图像时候可以进行更好地分割。 

5、U-net可以如何改进?

①可以对U-net中的损失函数进行改进。损失函数有很多种,U-net原文中采用的是有权重的交叉熵损失函数,主要为了更好地分离粘连在一起的同类细胞设计的,如果分割的任务不同,也可以往损失函数中添加权重或进行其他的改进,以增强分割的准确性和鲁棒性。

②可以对U-net结构进行改进,如采用U-net++网络,如图所示:

U-net++是在深度为4层的U-net基础上,把1~3层的U-net也全部组合到一起(图中左上角最小的三角形为深度为1层的U-net,第二个三角形为深度为2层的U-net,以此类推,把4个深度的U-net组合在一起),这个U-net++能够把每个深度的训练效果相互融合相互补充,可以对图像进行更为精确的分割。

 从零开始的U-net入门_Pterosaur_Zero的博客-CSDN博客_u-net目录前言一、U-net基础知识(1)ReLU函数(2)图像的卷积和反卷积(上采样)(3)池化层(下采样)(4)损失函数二、U-net入门(1)U-net的结构是怎么样的?(2)U-net的输入是什么?(3)U-net的卷积核大小、卷积核数量、卷积核中的数值、训练深度怎么确定?(4)如何解决U-net训练样本少的问题?(5)U-net可以如何改进?前言一、U-net基础知识(1)ReLU函数(2)图像的卷积和反卷积(上采样)(3)池化层.https://blog.csdn.net/qq_33924470/article/details/106891015

本文链接地址:https://www.jiuchutong.com/zhishi/294606.html 转载请保留说明!

上一篇:2023最新最全vscode插件精选(2023最新最全的祈祷视频)

下一篇:亚苏尼国家公园,厄瓜多尔 (© Paul Bertner/Minden Pictures)(苏尼亚尼)

  • 抖音怎么关联热点(抖音怎么关联热点才能通过)

    抖音怎么关联热点(抖音怎么关联热点才能通过)

  • 美图秀秀拼视频怎么没有原声音(美图秀秀拼视频为什么没有声音)

    美图秀秀拼视频怎么没有原声音(美图秀秀拼视频为什么没有声音)

  • 国际上网可以卸载吗(国际上网卸载了怎么下回来)

    国际上网可以卸载吗(国际上网卸载了怎么下回来)

  • 拼多多抢红包一天能抢多少(拼多多抢红包100元是真的吗)

    拼多多抢红包一天能抢多少(拼多多抢红包100元是真的吗)

  • 怎么辨别苹果11是不是原装(怎么辨别苹果11promax是不是原装屏)

    怎么辨别苹果11是不是原装(怎么辨别苹果11promax是不是原装屏)

  • 全民k歌魔音在哪里(全民k歌听歌模式)

    全民k歌魔音在哪里(全民k歌听歌模式)

  • 苹果7p手机录音功能在哪里(苹果7plus录音)

    苹果7p手机录音功能在哪里(苹果7plus录音)

  • 进程和程序的区别(进程和程序的区别有哪些)

    进程和程序的区别(进程和程序的区别有哪些)

  • oppo插耳机老是跳语音助手(oppo手机插耳机自动放音乐什么原因)

    oppo插耳机老是跳语音助手(oppo手机插耳机自动放音乐什么原因)

  • 在淘宝上开店需要什么(在淘宝上开店需要交钱吗)

    在淘宝上开店需要什么(在淘宝上开店需要交钱吗)

  • 淘宝可以换实名吗(淘宝换实名多久可以换)

    淘宝可以换实名吗(淘宝换实名多久可以换)

  • 万维网和因特网的关系(万维网和因特网不同点)

    万维网和因特网的关系(万维网和因特网不同点)

  • 抖音刷过的视频怎么查找(抖音刷过的视频有记录吗)

    抖音刷过的视频怎么查找(抖音刷过的视频有记录吗)

  • 新手直播卖衣服怎么弄(新手直播卖衣服需要准备什么)

    新手直播卖衣服怎么弄(新手直播卖衣服需要准备什么)

  • 荣耀v20解锁方式有几种(荣耀v20被锁定怎么刷机)

    荣耀v20解锁方式有几种(荣耀v20被锁定怎么刷机)

  • word怎样自动生成目录(word怎样自动生成目录索引)

    word怎样自动生成目录(word怎样自动生成目录索引)

  • 淘宝退货首重免费寄是咋回事(淘宝退货首重免费什么意思)

    淘宝退货首重免费寄是咋回事(淘宝退货首重免费什么意思)

  • 华为a03l是什么型号(华为a乚00是什么型号)

    华为a03l是什么型号(华为a乚00是什么型号)

  • 数据线3a和5a的区别(数据线买3a好还是5a好支持什么样的充电头??)

    数据线3a和5a的区别(数据线买3a好还是5a好支持什么样的充电头??)

  • 苹果双卡发短信怎么调(苹果双卡发短信不显示主副卡)

    苹果双卡发短信怎么调(苹果双卡发短信不显示主副卡)

  • qq怎么能看失效照片(怎样查看qq已经失效的文件)

    qq怎么能看失效照片(怎样查看qq已经失效的文件)

  • 酷狗音乐如何取消自动续费(酷狗音乐如何取消续费功能)

    酷狗音乐如何取消自动续费(酷狗音乐如何取消续费功能)

  • 缺少一个或多个shx文件(缺少一个或多个网络协议 windows10)

    缺少一个或多个shx文件(缺少一个或多个网络协议 windows10)

  • win10添加第二块硬盘(win10添加第二块硬盘怎么分区)

    win10添加第二块硬盘(win10添加第二块硬盘怎么分区)

  • 复制快捷键ctrl加什么介绍(复制快捷键ctrl+c)

    复制快捷键ctrl加什么介绍(复制快捷键ctrl+c)

  • 税收的经济效应是指税收对纳税人生产
  • 企业所得税留抵税额会显示在申报表上吗?
  • 质量扣款能按折扣计算吗
  • 金蝶标准版如何结转到下月
  • 工程款按进度付款开票分录
  • 做账一定要银行对账单吗
  • 虚拟货币会计分录
  • 存货项目包括哪些具体内容
  • 客户退货金额小怎么说
  • 购物中心联营扣点
  • 教育协会发的证有用吗
  • 理财产品增值税纳税人
  • 转让合同债权
  • 零申报有期限吗
  • 结转待转销项税额
  • 蓝字发票是什么票据类型
  • 个人所得税免税收入怎么填纳税申报表
  • 去年红字发票怎么做账
  • 合伙企业收到的合伙金计入什么科目
  • 民办非企业单位属于什么类型
  • 消费税的纳税地点在哪里
  • 个人购买余额宝安全吗?
  • 增值税普通发票有什么用
  • 货运发票与运输发票的区别
  • 增值税一般项目是指什么
  • 对外捐赠会计和税法差异调整
  • 清华同方bios通用密码(thtfpc)
  • 外贸收汇怎么处理
  • 参保各险种人数统计
  • win7怎么添加设备
  • 以固定资产对外投资交税吗
  • 增值税进项税转出什么意思
  • dotnetfx.exe
  • 查补以前年度收入
  • 最早的滑盖手机,摄像头可以自动旋转
  • 外汇业务的核算ppt
  • 气泡星云图片
  • 报销差旅费会计凭证
  • 搜索神器官网
  • 开具增值税专用发票的要求
  • linux写c++程序
  • vue路由的理解
  • 手撕代码是啥意思
  • 车费增值税税率
  • bootstrapstandby
  • 餐饮业会计做账怎么做
  • 小规模纳税人免税额度是多少
  • 个体户需要
  • 短期借款的其它账户
  • 企业开办期间账务处理
  • 允许在企业所得税税前扣除的
  • 营改增抵减的销项税额是什么意思
  • 公司注销其他应付款怎么冲平
  • 软件开发服务费税率
  • 工业企业外购存货成本有
  • 增值税申报开具其他发票包含哪些
  • 商会开年会费用怎么入账
  • mysql的知识点
  • WinXP系统VPN连接经常性自动断开的4个解决方法
  • freebsd操作命令
  • freebsd操作命令
  • centos7 network
  • windowxp怎么取消开机密码
  • 0x81000204错误
  • win10如何删除windows账户
  • linux补丁工具
  • linux userdel
  • 日历控件默认日期
  • jsclass选择器
  • linux spid
  • bat批处理视频教程
  • Python中str is not callable问题详解及解决办法
  • Jar mismatch! Fix your dependencies
  • python生成随机数据
  • Python 正则表达式入门(初级篇)
  • html5游戏引擎排行
  • 安卓自定义动态壁纸
  • python函数入门
  • 台资企业有什么
  • 工资薪金的税收金额是填实际发生还是帐载金额
  • 免责声明:网站部分图片文字素材来源于网络,如有侵权,请及时告知,我们会第一时间删除,谢谢! 邮箱:opceo@qq.com

    鄂ICP备2023003026号

    网站地图: 企业信息 工商信息 财税知识 网络常识 编程技术

    友情链接: 武汉网站建设