位置: IT常识 - 正文

WGAN(Wasserstein GAN)看这一篇就够啦,WGAN论文解读

编辑:rootadmin
WGAN(Wasserstein GAN)看这一篇就够啦,WGAN论文解读

推荐整理分享WGAN(Wasserstein GAN)看这一篇就够啦,WGAN论文解读,希望有所帮助,仅作参考,欢迎阅读内容。

文章相关热门搜索词:,内容如对您有帮助,希望把文章链接给更多的朋友!

WGAN论文地址:[1701.07875] Wasserstein GAN (arxiv.org)

WGAN解决的问题原始GAN训练过程中经常遇到的问题:模式崩溃,生成器生成非常窄的分布,仅覆盖数据分 布中的单一模式。 模式崩溃的含义是生成器只能生成非常相似的样本(例如 ,MNIST中的单个数字),即生成的样本不是多样的。没有指标可以告诉我们收敛情况。生成器和判别器的 loss并没有告诉我们任何收敛相关信息。当然,我们可以通 过不时地查看生成器生成的数据来监控训练进度。但是, 这是一个手动过程。因此,我们需要有一个可解释的指标 可以告诉我们有关训练的进度。

一句话概括:判别器越好,生成器梯度消失越严重。

      GAN网络训练的重点在于均衡生成器与判别器,若判别器太 强,loss没有再下降,生成器学习不到东西,生成图像的质量 便不会再有提升。

        在最优判别器的下,我们可以把原始GAN定义的生成器loss 等价变换为最小化真实分布与生成分布之间的JS散度。 我们越训练判别器,它就越接近最优,最小化生成器的loss也 就会越近似于最小化真实分布与生成分布之间的JS散度。

关键点就在于如何评价生成图片和真实图片之间的距离

 JS散度存在的问题

如果希望两个分布之间越接近它们的JS散度越小,我们通过 优化JS散度就能将生成分布拉向真实分布,最终以假乱真。 这个希望在两个分布有所重叠的时候是成立的,但是如果两 个分布完全没有重叠的部分,或者它们重叠的部分可忽略, 那它们的JS散度就一直是 log2。

在原始GAN的(近似)最优判别器下,生成器loss面临梯度 消失问题。 也面临优化目标荒谬、梯度不稳定、对多样性与准确性惩罚 不平衡导致mode collapse问题。

原始GAN问题的根源可以归结为两点,

等价优化的距离衡量(JS散度)不合理生成器随机初始化后的生成分布很难与真实分布有不可 忽略的重叠

Wasserstein GAN(WGAN)就是希望解决上述两个问题

解决原始GAN问题的方法WGAN(Wasserstein GAN)看这一篇就够啦,WGAN论文解读

解决问题的关键在于使用 Wasserstein距离 衡量两个分布之间的距离 Wasserstein距离 优越性在于: 即使两个分布没有任何重叠,也可以反应他们之间的距离。

Wasserstein距离

P和Q为两个分布:P分布为一堆土,Q分布为要移到的目标,那么要移动P达到Q,哪种距离更小呢?

最好的移动方案: 

使用Wasserstein距离, 无论两个分布多远,都有梯度,都是可以更新的

WGAN设计 

原始的生成对抗网络,所要优化的目标函数为:

 此目标函数可以分为两部分来看: ①固定生成器 G,优化判别器 D, 则上式可以写成如下形式:

可以转化为最小化形式: 

②固定判别器 D,优化生成器 G,舍去前面的常数,

相当于最小化: 

我们要构建一个判别器 D,使得 D 的参数不超过某个固定的 常数,最后一层是非线性层,并且使下面式子最大化:

 这是一种数学的近似,同要求梯度变化的不要太猛。那么怎么梯度更新呢?因为D有了限制,无法直接利用SGD。 这里引入一种方法:Weight clipping 就是强制令权重w 限制在c ~ -c之间。在参数更新后,如果 w>c,则令w=c, 如果w<-c,则令w=-c

WGAN的实现

WGAN与原始GAN第一种形式相比,只改了四点:

判别器最后一层去掉sigmoid生成器和判别器的loss不取log每次更新判别器的参数之后把它们的值截断到不超过一个 固定常数c不要用基于动量的优化算法(包括momentum和 Adam),推荐RMSProp

WGAN本作引入了Wasserstein距离,由于它相对KL散度与JS 散度具有优越的平滑特性,理论上可以解决梯度消失问题。接 着通过数学变换将Wasserstein距离写成可求解的形式,利用 一个参数数值范围受限的判别器神经网络来较大化这个形式, 就可以近似Wasserstein距离。

WGAN既解决了训练不稳定的问题,也提供了一个可靠的训 练进程指标,而且该指标确实与生成样本的质量高度相关。

本文链接地址:https://www.jiuchutong.com/zhishi/297763.html 转载请保留说明!

上一篇:2023MathorcupC题电商物流网络包裹应急调运与结构优化问题建模详解+模型代码(一)(2021mathorcupc题答案)

下一篇:分享项目 - Vue3 + TS + element-ui-plus 项目 -- Table表格表单(分享项目成果)

  • 拼多多怎么删除银行卡绑定呢(拼多多怎么删除评价)

    拼多多怎么删除银行卡绑定呢(拼多多怎么删除评价)

  • 如何设置华为手机的微信收款语音播报(如何设置华为手机锁屏时间)

    如何设置华为手机的微信收款语音播报(如何设置华为手机锁屏时间)

  • 华为畅享10e有指纹解锁吗(华为畅享10e有指南针吗)

    华为畅享10e有指纹解锁吗(华为畅享10e有指南针吗)

  • 手机钉钉如何退出登录(手机钉钉如何退出企业组织)

    手机钉钉如何退出登录(手机钉钉如何退出企业组织)

  • 华为手机激活了能退货吗(华为手机激活了想退怎么办)

    华为手机激活了能退货吗(华为手机激活了想退怎么办)

  • 苹果8后面是什么型号(苹果8后面是什么样子的)

    苹果8后面是什么型号(苹果8后面是什么样子的)

  • qq投票发起人能看到谁投的吗(qq投票发起人能看到吗)

    qq投票发起人能看到谁投的吗(qq投票发起人能看到吗)

  • ipad控制中心不见了(ipad控制中心不能调节音量)

    ipad控制中心不见了(ipad控制中心不能调节音量)

  • 微信聊天界面右上角有个圆圈(微信聊天界面右边有个小弹窗)

    微信聊天界面右上角有个圆圈(微信聊天界面右边有个小弹窗)

  • oppohd模式是什么意思(oppohd模式有什么用)

    oppohd模式是什么意思(oppohd模式有什么用)

  • 抖音企业认证通过后可以取消吗(抖音企业认证通过后如何操作)

    抖音企业认证通过后可以取消吗(抖音企业认证通过后如何操作)

  • ps软件变黑白快捷键(ps怎么变黑白色)

    ps软件变黑白快捷键(ps怎么变黑白色)

  • 微信被拉黑还能群聊吗(微信被拉黑还能看到聊天记录吗)

    微信被拉黑还能群聊吗(微信被拉黑还能看到聊天记录吗)

  • 5g路由器是指5g网络么(5g路由器和5g网络有什么区别吗)

    5g路由器是指5g网络么(5g路由器和5g网络有什么区别吗)

  • iphone怎么拍live动图(iphone怎么拍流水效果)

    iphone怎么拍live动图(iphone怎么拍流水效果)

  • OPPO k5怎么隐藏照片(oppok5怎么隐藏微信电话)

    OPPO k5怎么隐藏照片(oppok5怎么隐藏微信电话)

  • 苹果手机除尘模式在哪里(苹果手机除尘模式怎么开)

    苹果手机除尘模式在哪里(苹果手机除尘模式怎么开)

  • 小度音箱如何控制灯(小度音箱如何控制空调)

    小度音箱如何控制灯(小度音箱如何控制空调)

  • 怎么做投标文件(怎么做投标文件?)

    怎么做投标文件(怎么做投标文件?)

  • potato如何快速加好友(potato怎么加s)

    potato如何快速加好友(potato怎么加s)

  • 2014812是红米几(红米手机2014812是红米几)

    2014812是红米几(红米手机2014812是红米几)

  • 192.168.1.1修改密码设置(19216811修改密码登录页面)

    192.168.1.1修改密码设置(19216811修改密码登录页面)

  • 手机压缩包异常怎么办(手机压缩包异常怎么办rar)

    手机压缩包异常怎么办(手机压缩包异常怎么办rar)

  • 关于激活OS X Yosemite深色模式的方法介绍(关于激活函数的说法错误的是)

    关于激活OS X Yosemite深色模式的方法介绍(关于激活函数的说法错误的是)

  • vue使用Print.js打印页面样式不出现的解决(vue-print-nb-jeecg)

    vue使用Print.js打印页面样式不出现的解决(vue-print-nb-jeecg)

  • 降低个人税负什么意思
  • 耕地占用税退税政策
  • 开专用发票可以直接写加工费这个明细吗
  • 微型企业政府补贴政策
  • 发票上是17%的税率吗
  • 个人减税具体政策
  • 科目期初余额的录入需要从上级科目开始
  • 标准的现金流量表格式
  • 电子承兑汇票是到期日前10天提示承兑吗
  • 新成立的公司银行存款如何入账
  • 特殊建造行业
  • 2017年个税税率表及个税计算公式
  • 固定资产折旧计入成本还是费用
  • 固定资产怎么填报
  • 承兑贴息收入账务处理怎么做?
  • 实收金额比应收金额多
  • 电脑医生怎么卸载
  • linux 传输文件
  • php面向对象的三大特征
  • php上传文件夹
  • 企业核定征收管理办法
  • 退回多缴所得税做贷方本期发生额没有
  • PHP:mcrypt_enc_get_key_size()的用法_Mcrypt函数
  • 图像分割 unet
  • 购买加油卡能否抵扣
  • php全局函数
  • linux中web服务器的安装,配置与测试
  • 公章的法律效力范围
  • vue中用echarts
  • collection的属性
  • 可供出售金融资产新准则叫什么
  • python requests检测响应状态码
  • 借受托代销商品贷受托代销商品款
  • 残保基金什么时候申报
  • 债务豁免会计核算
  • 应付利息什么时候确认收入
  • 恢复从回收站已经清除的文件
  • sql,server
  • 用人单位垫付生育津贴垫付金额和垫付天数
  • 怎么判断其他债权债务
  • 固定资产以前年度多计提怎么办
  • 行政事业单位其他收入
  • 资产负债表的作用体现在哪些方面
  • 物业公司代收代缴水电费
  • 合伙企业对外投资收益怎么纳税
  • 个人垫付的费用如何向单位报销行政单位
  • 折旧和摊销的概念
  • 新成立的公司工会经费免交一年吗
  • 物流公司会计工作内容
  • 金融企业借款费用计入
  • sql servers
  • sql server索引的使用
  • mysql中decimal对应java类型
  • mysql修改密码错误
  • hosts文件不起作用
  • 优盘安装xp
  • 360误删文件恢复怎么恢复
  • centos ll
  • centos7 zsh
  • windows默认程序设置
  • win7系统搜索不到自己家wi-fi
  • ssh直接输入密码 linux
  • linux中sed命令
  • 激活 win7
  • win10系统注册名修改
  • 慎用小儿百部止咳糖浆
  • 批处理有何限制
  • python pyo
  • preorder遍历
  • js表单事件有哪些
  • javascript中的函数如何理解
  • js刷新当前窗口
  • js控制并发数
  • js过滤特殊字符
  • 企业自建旧房产怎么处理
  • 契税完税证明怎么补打
  • 保险代理人非公司员工
  • 买楼送地下室划算吗
  • 遵从和尊重
  • 济南保安证查询系统
  • 免责声明:网站部分图片文字素材来源于网络,如有侵权,请及时告知,我们会第一时间删除,谢谢! 邮箱:opceo@qq.com

    鄂ICP备2023003026号

    网站地图: 企业信息 工商信息 财税知识 网络常识 编程技术

    友情链接: 武汉网站建设