位置: IT常识 - 正文

WGAN(Wasserstein GAN)看这一篇就够啦,WGAN论文解读

编辑:rootadmin
WGAN(Wasserstein GAN)看这一篇就够啦,WGAN论文解读

推荐整理分享WGAN(Wasserstein GAN)看这一篇就够啦,WGAN论文解读,希望有所帮助,仅作参考,欢迎阅读内容。

文章相关热门搜索词:,内容如对您有帮助,希望把文章链接给更多的朋友!

WGAN论文地址:[1701.07875] Wasserstein GAN (arxiv.org)

WGAN解决的问题原始GAN训练过程中经常遇到的问题:模式崩溃,生成器生成非常窄的分布,仅覆盖数据分 布中的单一模式。 模式崩溃的含义是生成器只能生成非常相似的样本(例如 ,MNIST中的单个数字),即生成的样本不是多样的。没有指标可以告诉我们收敛情况。生成器和判别器的 loss并没有告诉我们任何收敛相关信息。当然,我们可以通 过不时地查看生成器生成的数据来监控训练进度。但是, 这是一个手动过程。因此,我们需要有一个可解释的指标 可以告诉我们有关训练的进度。

一句话概括:判别器越好,生成器梯度消失越严重。

      GAN网络训练的重点在于均衡生成器与判别器,若判别器太 强,loss没有再下降,生成器学习不到东西,生成图像的质量 便不会再有提升。

        在最优判别器的下,我们可以把原始GAN定义的生成器loss 等价变换为最小化真实分布与生成分布之间的JS散度。 我们越训练判别器,它就越接近最优,最小化生成器的loss也 就会越近似于最小化真实分布与生成分布之间的JS散度。

关键点就在于如何评价生成图片和真实图片之间的距离

 JS散度存在的问题

如果希望两个分布之间越接近它们的JS散度越小,我们通过 优化JS散度就能将生成分布拉向真实分布,最终以假乱真。 这个希望在两个分布有所重叠的时候是成立的,但是如果两 个分布完全没有重叠的部分,或者它们重叠的部分可忽略, 那它们的JS散度就一直是 log2。

在原始GAN的(近似)最优判别器下,生成器loss面临梯度 消失问题。 也面临优化目标荒谬、梯度不稳定、对多样性与准确性惩罚 不平衡导致mode collapse问题。

原始GAN问题的根源可以归结为两点,

等价优化的距离衡量(JS散度)不合理生成器随机初始化后的生成分布很难与真实分布有不可 忽略的重叠

Wasserstein GAN(WGAN)就是希望解决上述两个问题

解决原始GAN问题的方法WGAN(Wasserstein GAN)看这一篇就够啦,WGAN论文解读

解决问题的关键在于使用 Wasserstein距离 衡量两个分布之间的距离 Wasserstein距离 优越性在于: 即使两个分布没有任何重叠,也可以反应他们之间的距离。

Wasserstein距离

P和Q为两个分布:P分布为一堆土,Q分布为要移到的目标,那么要移动P达到Q,哪种距离更小呢?

最好的移动方案: 

使用Wasserstein距离, 无论两个分布多远,都有梯度,都是可以更新的

WGAN设计 

原始的生成对抗网络,所要优化的目标函数为:

 此目标函数可以分为两部分来看: ①固定生成器 G,优化判别器 D, 则上式可以写成如下形式:

可以转化为最小化形式: 

②固定判别器 D,优化生成器 G,舍去前面的常数,

相当于最小化: 

我们要构建一个判别器 D,使得 D 的参数不超过某个固定的 常数,最后一层是非线性层,并且使下面式子最大化:

 这是一种数学的近似,同要求梯度变化的不要太猛。那么怎么梯度更新呢?因为D有了限制,无法直接利用SGD。 这里引入一种方法:Weight clipping 就是强制令权重w 限制在c ~ -c之间。在参数更新后,如果 w>c,则令w=c, 如果w<-c,则令w=-c

WGAN的实现

WGAN与原始GAN第一种形式相比,只改了四点:

判别器最后一层去掉sigmoid生成器和判别器的loss不取log每次更新判别器的参数之后把它们的值截断到不超过一个 固定常数c不要用基于动量的优化算法(包括momentum和 Adam),推荐RMSProp

WGAN本作引入了Wasserstein距离,由于它相对KL散度与JS 散度具有优越的平滑特性,理论上可以解决梯度消失问题。接 着通过数学变换将Wasserstein距离写成可求解的形式,利用 一个参数数值范围受限的判别器神经网络来较大化这个形式, 就可以近似Wasserstein距离。

WGAN既解决了训练不稳定的问题,也提供了一个可靠的训 练进程指标,而且该指标确实与生成样本的质量高度相关。

本文链接地址:https://www.jiuchutong.com/zhishi/297763.html 转载请保留说明!

上一篇:2023MathorcupC题电商物流网络包裹应急调运与结构优化问题建模详解+模型代码(一)(2021mathorcupc题答案)

下一篇:分享项目 - Vue3 + TS + element-ui-plus 项目 -- Table表格表单(分享项目成果)

  • 万家乐e2热水器故障怎么解决(万家乐热水器e2故障排除)

    万家乐e2热水器故障怎么解决(万家乐热水器e2故障排除)

  • 拼多多预售可以取消吗(拼多多预售可以催发货吗)

    拼多多预售可以取消吗(拼多多预售可以催发货吗)

  • 什么是mns(什么是m女)

    什么是mns(什么是m女)

  • 怎样重新申请抖音号(我想重新申请个抖音号,该怎么申请?)

    怎样重新申请抖音号(我想重新申请个抖音号,该怎么申请?)

  • 电子发票不能生成pdf(电子发票不能生成怎办)

    电子发票不能生成pdf(电子发票不能生成怎办)

  • 钉钉看回放老师知道吗(钉钉看回放老师那里怎么显示)

    钉钉看回放老师知道吗(钉钉看回放老师那里怎么显示)

  • 手机没有颜色了,怎么调回来(手机没有颜色了怎么调回来)

    手机没有颜色了,怎么调回来(手机没有颜色了怎么调回来)

  • 苹果11可以单独换外屏吗(苹果11可以单独设置闹钟音量吗)

    苹果11可以单独换外屏吗(苹果11可以单独设置闹钟音量吗)

  • 投影仪遥控器突然失灵(投影仪遥控器突然不能用了)

    投影仪遥控器突然失灵(投影仪遥控器突然不能用了)

  • 电脑开机红屏是什么原因(电脑开机红屏怎么办恢复)

    电脑开机红屏是什么原因(电脑开机红屏怎么办恢复)

  • ppt设置艺术字的具体位置(ppt设置艺术字的位置为水平)

    ppt设置艺术字的具体位置(ppt设置艺术字的位置为水平)

  • excel包括哪些功能(excel主要功能有哪些)

    excel包括哪些功能(excel主要功能有哪些)

  • 演示文档的扩展名(演示文稿扩展)

    演示文档的扩展名(演示文稿扩展)

  • 工频和变频的区别(变频和工频哪个更省电)

    工频和变频的区别(变频和工频哪个更省电)

  • 酷我音乐在哪里投票(酷我音乐在哪里k歌)

    酷我音乐在哪里投票(酷我音乐在哪里k歌)

  • watch gt2怎么使用手电筒(watch gt2设置在哪)

    watch gt2怎么使用手电筒(watch gt2设置在哪)

  • qq账号永久封能解封吗(qq号封永久了能不能解开)

    qq账号永久封能解封吗(qq号封永久了能不能解开)

  • 魅族手机如何使用小爱同学(魅族手机如何使用OTG功能)

    魅族手机如何使用小爱同学(魅族手机如何使用OTG功能)

  • vivoy3电池多大毫安(vivoy3电池容量多大)

    vivoy3电池多大毫安(vivoy3电池容量多大)

  • proteus如何仿真(proteus如何仿真stm32)

    proteus如何仿真(proteus如何仿真stm32)

  • 设置备注和标签怎么弄(设置备注和标签电话号码怎么取消)

    设置备注和标签怎么弄(设置备注和标签电话号码怎么取消)

  • 苹果手机飞行模式提示音是什么(苹果手机飞行模式了闹钟还会响吗)

    苹果手机飞行模式提示音是什么(苹果手机飞行模式了闹钟还会响吗)

  • Win11如何设置快捷键关机 Win11设置快捷键关机的方法(Win11如何设置快捷键调音量)

    Win11如何设置快捷键关机 Win11设置快捷键关机的方法(Win11如何设置快捷键调音量)

  • pruttct.exe - pruttct是什么进程 有什么用

    pruttct.exe - pruttct是什么进程 有什么用

  • Vue3中watch监听对象的属性值,监听源必须是一个getter函数(vue watch监听localstorage变化)

    Vue3中watch监听对象的属性值,监听源必须是一个getter函数(vue watch监听localstorage变化)

  • API接口安全性设计(api接口安全措施)

    API接口安全性设计(api接口安全措施)

  • 房地产开发企业资质等级有几个
  • 什么情况下纳税人和负税人一致
  • 收益性支出包括哪些内容
  • 季报申报之后还可以改吗?
  • 资产负债表从哪里打出来的
  • 支付宝过路费开票小程序
  • 企业所得税业务费扣除标准
  • 购物中心联营扣点
  • 企业收到免税发票后怎么开票
  • 变更法人税务怎么变更
  • 企业向关联方借款是否可以无偿
  • 出售房产收入计入什么科目
  • 新个税过了申报期怎么办
  • 公司买汽车怎么做内账
  • 单张发票不超过1万
  • 多交增值税如何退回
  • 公司终止的时间是进行注销登记生效后
  • 员工福利没有发票
  • 税控盘提示未抄报税
  • 继承有个人所得税吗
  • 销项增值税普通发票
  • 企业所得税以前年度亏损怎么弥补
  • 公允出资税务处理怎么做?
  • windows伪装电脑mac
  • 企业收到留抵退税宣传报道
  • 银行承兑汇票有纸质的吗
  • 以前年度多计提的税金怎么调整
  • php静态变量生命周期
  • 招待客户住宿的句子
  • 公司为实习生买保险列支什么科目?
  • uniapp监听网络状态
  • vue数据处理在哪个阶段
  • 利息费用可扣除什么
  • 税收原则的含义
  • 金融资产的会计处理方法
  • 资产负债表左方烈士的资产按什么排列
  • Ichetucknee河的海牛,佛罗里达州 (© Jennifer Adler/Alamy)
  • php 可变变量
  • 劳务派遣应纳税额如何计算
  • php curl cookie
  • 应交增值税减免税额在借方
  • 金蝶利息收入结转怎么弄
  • yolov5 output
  • css3的模块结构和应用
  • 随货赠品会计处理
  • db2 -x
  • linux mongodb配置文件
  • 自然人代开经营所得汇算清缴怎么做
  • 公司注销其他应收款怎么冲平
  • 出口关税的计算公式
  • 口罩属于什么经济分类
  • 小规模纳税人未开票收入如何申报增值税
  • 公司购买不动产契税税率
  • 城镇土地使用税怎么算
  • 并购 投资
  • 股东分红的会计分录怎么做
  • 债权人和债务人的区别
  • 保险工资单怎么开
  • 年度汇算清缴要补税怎么办
  • 会计所说的内账外账
  • 换工作时社保公积金怎么办
  • 凭证上的数字金额怎么填
  • mac下安装anaconda
  • 预装win7系统
  • linux系统输入法锁定了怎么解开
  • windowsxp如何创建宽带连接
  • mac怎么安装安装包
  • win8.1拨号上网
  • win7系统防火墙无法关闭
  • 安装win7系统后一直正在启动
  • react增删改查功能
  • bat批处理命令大全
  • 浏览器修改js变量
  • XML、HTML、CSS与JS的区别整理
  • Android 自定义view炫酷动画
  • javascript图表
  • 河北省税务局地址邮编
  • 运输类增值税
  • 深圳市百旺信投资有限责任公司
  • 关于公司纳税
  • 免责声明:网站部分图片文字素材来源于网络,如有侵权,请及时告知,我们会第一时间删除,谢谢! 邮箱:opceo@qq.com

    鄂ICP备2023003026号

    网站地图: 企业信息 工商信息 财税知识 网络常识 编程技术

    友情链接: 武汉网站建设