位置: IT常识 - 正文

WGAN(Wasserstein GAN)看这一篇就够啦,WGAN论文解读

编辑:rootadmin
WGAN(Wasserstein GAN)看这一篇就够啦,WGAN论文解读

推荐整理分享WGAN(Wasserstein GAN)看这一篇就够啦,WGAN论文解读,希望有所帮助,仅作参考,欢迎阅读内容。

文章相关热门搜索词:,内容如对您有帮助,希望把文章链接给更多的朋友!

WGAN论文地址:[1701.07875] Wasserstein GAN (arxiv.org)

WGAN解决的问题原始GAN训练过程中经常遇到的问题:模式崩溃,生成器生成非常窄的分布,仅覆盖数据分 布中的单一模式。 模式崩溃的含义是生成器只能生成非常相似的样本(例如 ,MNIST中的单个数字),即生成的样本不是多样的。没有指标可以告诉我们收敛情况。生成器和判别器的 loss并没有告诉我们任何收敛相关信息。当然,我们可以通 过不时地查看生成器生成的数据来监控训练进度。但是, 这是一个手动过程。因此,我们需要有一个可解释的指标 可以告诉我们有关训练的进度。

一句话概括:判别器越好,生成器梯度消失越严重。

      GAN网络训练的重点在于均衡生成器与判别器,若判别器太 强,loss没有再下降,生成器学习不到东西,生成图像的质量 便不会再有提升。

        在最优判别器的下,我们可以把原始GAN定义的生成器loss 等价变换为最小化真实分布与生成分布之间的JS散度。 我们越训练判别器,它就越接近最优,最小化生成器的loss也 就会越近似于最小化真实分布与生成分布之间的JS散度。

关键点就在于如何评价生成图片和真实图片之间的距离

 JS散度存在的问题

如果希望两个分布之间越接近它们的JS散度越小,我们通过 优化JS散度就能将生成分布拉向真实分布,最终以假乱真。 这个希望在两个分布有所重叠的时候是成立的,但是如果两 个分布完全没有重叠的部分,或者它们重叠的部分可忽略, 那它们的JS散度就一直是 log2。

在原始GAN的(近似)最优判别器下,生成器loss面临梯度 消失问题。 也面临优化目标荒谬、梯度不稳定、对多样性与准确性惩罚 不平衡导致mode collapse问题。

原始GAN问题的根源可以归结为两点,

等价优化的距离衡量(JS散度)不合理生成器随机初始化后的生成分布很难与真实分布有不可 忽略的重叠

Wasserstein GAN(WGAN)就是希望解决上述两个问题

解决原始GAN问题的方法WGAN(Wasserstein GAN)看这一篇就够啦,WGAN论文解读

解决问题的关键在于使用 Wasserstein距离 衡量两个分布之间的距离 Wasserstein距离 优越性在于: 即使两个分布没有任何重叠,也可以反应他们之间的距离。

Wasserstein距离

P和Q为两个分布:P分布为一堆土,Q分布为要移到的目标,那么要移动P达到Q,哪种距离更小呢?

最好的移动方案: 

使用Wasserstein距离, 无论两个分布多远,都有梯度,都是可以更新的

WGAN设计 

原始的生成对抗网络,所要优化的目标函数为:

 此目标函数可以分为两部分来看: ①固定生成器 G,优化判别器 D, 则上式可以写成如下形式:

可以转化为最小化形式: 

②固定判别器 D,优化生成器 G,舍去前面的常数,

相当于最小化: 

我们要构建一个判别器 D,使得 D 的参数不超过某个固定的 常数,最后一层是非线性层,并且使下面式子最大化:

 这是一种数学的近似,同要求梯度变化的不要太猛。那么怎么梯度更新呢?因为D有了限制,无法直接利用SGD。 这里引入一种方法:Weight clipping 就是强制令权重w 限制在c ~ -c之间。在参数更新后,如果 w>c,则令w=c, 如果w<-c,则令w=-c

WGAN的实现

WGAN与原始GAN第一种形式相比,只改了四点:

判别器最后一层去掉sigmoid生成器和判别器的loss不取log每次更新判别器的参数之后把它们的值截断到不超过一个 固定常数c不要用基于动量的优化算法(包括momentum和 Adam),推荐RMSProp

WGAN本作引入了Wasserstein距离,由于它相对KL散度与JS 散度具有优越的平滑特性,理论上可以解决梯度消失问题。接 着通过数学变换将Wasserstein距离写成可求解的形式,利用 一个参数数值范围受限的判别器神经网络来较大化这个形式, 就可以近似Wasserstein距离。

WGAN既解决了训练不稳定的问题,也提供了一个可靠的训 练进程指标,而且该指标确实与生成样本的质量高度相关。

本文链接地址:https://www.jiuchutong.com/zhishi/297763.html 转载请保留说明!

上一篇:2023MathorcupC题电商物流网络包裹应急调运与结构优化问题建模详解+模型代码(一)(2021mathorcupc题答案)

下一篇:分享项目 - Vue3 + TS + element-ui-plus 项目 -- Table表格表单(分享项目成果)

  • i7 9700f和i7 9700kf区别(i7 9700kf怎么样)

    i7 9700f和i7 9700kf区别(i7 9700kf怎么样)

  • 抖音发不了作品是怎么回事(抖音发不了作品是被人举报了吗)

    抖音发不了作品是怎么回事(抖音发不了作品是被人举报了吗)

  • 微信收款音箱s1和s2和s3区别(微信收款音箱s1怎么拆开)

    微信收款音箱s1和s2和s3区别(微信收款音箱s1怎么拆开)

  • QQ怎么查近5年的qq红包记录

    QQ怎么查近5年的qq红包记录

  • 隔空投送手机有记录吗(隔空投送手机有什么用)

    隔空投送手机有记录吗(隔空投送手机有什么用)

  • qq充值记录怎么删除不了(qq充值记录怎么隐藏)

    qq充值记录怎么删除不了(qq充值记录怎么隐藏)

  • 2060比1660ti强多少(2060和1660ti对比评测)

    2060比1660ti强多少(2060和1660ti对比评测)

  • 浏览网页时遇到的最常见的网络广告形式是?(浏览网页时遇到的最常见的网络广告形式是)

    浏览网页时遇到的最常见的网络广告形式是?(浏览网页时遇到的最常见的网络广告形式是)

  • word删除所有页眉(word删除所有页眉横线)

    word删除所有页眉(word删除所有页眉横线)

  • 探探账号异常能恢复吗(探探账号异常能干啥)

    探探账号异常能恢复吗(探探账号异常能干啥)

  • 电脑excel怎么下载

    电脑excel怎么下载

  • 手机照片怎么镜像翻转(手机照片怎么镜面对称)

    手机照片怎么镜像翻转(手机照片怎么镜面对称)

  • 大众点评删除聊天记录(大众点评删除聊天在线咨询)

    大众点评删除聊天记录(大众点评删除聊天在线咨询)

  • 荣耀v20支持屏幕解锁吗(荣耀v20屏幕是)

    荣耀v20支持屏幕解锁吗(荣耀v20屏幕是)

  • 华为nova5pro时间怎么设置24小时(华为nova5pro时间在哪设置)

    华为nova5pro时间怎么设置24小时(华为nova5pro时间在哪设置)

  • 嗨来电怎样接电话(嗨来电怎么自己制作视频)

    嗨来电怎样接电话(嗨来电怎么自己制作视频)

  • gtx2080和rtx2080区别

    gtx2080和rtx2080区别

  • 共享单车如何知道附近有车(共享单车怎么看骑行范围)

    共享单车如何知道附近有车(共享单车怎么看骑行范围)

  • hisilicon kirin是什么(hisiliconkirin是不是麒麟)

    hisilicon kirin是什么(hisiliconkirin是不是麒麟)

  • Pytorch1.7复现PointNet++点云分割(含Open3D可视化)(文末有一个自己做的书缝识别项目代码)(pytorch复制模型)

    Pytorch1.7复现PointNet++点云分割(含Open3D可视化)(文末有一个自己做的书缝识别项目代码)(pytorch复制模型)

  • 在windows下安装nnUnet,并制作数据集以及运行(让隔壁奶奶也能学会的教程)(在windows中安装应用程序的途径)

    在windows下安装nnUnet,并制作数据集以及运行(让隔壁奶奶也能学会的教程)(在windows中安装应用程序的途径)

  • 基于卷积神经网络CNN的图片分类实现——附代码(基于卷积神经网络的网络入侵检测算法设计与实现)

    基于卷积神经网络CNN的图片分类实现——附代码(基于卷积神经网络的网络入侵检测算法设计与实现)

  • 个人所得税汇算清缴截止日期
  • 丢失增值税专用发票最新规定
  • 所得税退税会计账务怎么处理
  • 养老保险滞纳金最高限额规定
  • 子公司内部交易抵消举例说明
  • 利润表盈利结构分析
  • 小规模纳税人免税销售额是含税还是不含税
  • 个人借款给公司利息收入要交税吗
  • 坏账准备的账务处理怎么理解
  • 手续费及佣金收入
  • 应收账款计提坏账后收回的会计分录
  • 房地产开发成本费用明细表
  • 企业所得税营业税金及附加
  • 虚开发票什么意思?
  • 一般纳税人能否享受残保金优惠
  • 3%增值税专用发票可以抵扣多少
  • 企业停工期间发放工资
  • windows10如何调出虚拟键盘
  • 如何免费获取网页文字
  • 工会经费是不是应付职工薪酬
  • 其他现代服务业是什么
  • 清算所得税申报表范本
  • win11怎么打开虚拟内存
  • 公司债务转个人债务
  • win11 zen2
  • 异地设立的仓库怎么处理
  • 有销项无进项税务局会怎么罚
  • 进程process.acore已停止怎么办
  • 金鱼花的养殖方法与注意事项
  • php redis常用命令
  • PHP:proc_close()的用法_命令行函数
  • php中file
  • 短期投资计入什么科目
  • 业务招待费能不能计入销售费用
  • 财务人员如何管控费用支出
  • vue 首页
  • 项目的分包行为是否合理
  • 结存材料实际成本分录
  • 少数股东权益贷方表示什么意思
  • 其他经营收益怎么算
  • 考到二本
  • ue4ui界面制作
  • mysql分表数量取决于什么
  • phpcms使用教程
  • 银行开出的承兑怎么兑现
  • 进货该怎么进
  • 平行结转分步法的特点
  • 未能确认收入的原因
  • 购销合同谁来做
  • 物业公司一般纳税人简易征收
  • 房东房租不开票违法吗
  • 农产品收购发票使用范围
  • 其他应付款长期挂账几年必须转收入
  • 可转换债券发行主体
  • 公司转投资是什么意思
  • 内部产生的商誉应确认为无形资产
  • 发票金额太大怎么办
  • 会计中为什么要用黑色笔写
  • 市场营销策划开票品目
  • 递延收益确认的递延所得税资产有期限吗
  • 会计准则 职工福利
  • 使用mysql进行模糊查询
  • mysql和c
  • 如何删除win10系统
  • Win10系统中怎么将文件夹进行压缩
  • onekey driver version是什么软件
  • launcher.exe是什么程序
  • PHPMyAdmin 2.7.0-pl1下载
  • 龙芯芯片组
  • perl脚本调试方法
  • css checked
  • javascript制作简易计算机
  • jquery的实现原理
  • asyncio 的 coroutine对象 与 Future对象使用指南
  • 手把手教你自己做菜
  • 胰腺在人体的哪个部位图解
  • jquery中选择器分为哪三种
  • 支付给境外的咨询费需要什么资料
  • 小学的困难补助什么时候发
  • 村级服务公开的具体内容
  • 免责声明:网站部分图片文字素材来源于网络,如有侵权,请及时告知,我们会第一时间删除,谢谢! 邮箱:opceo@qq.com

    鄂ICP备2023003026号

    网站地图: 企业信息 工商信息 财税知识 网络常识 编程技术

    友情链接: 武汉网站建设