位置: IT常识 - 正文

对抗生成网络(GAN)中的损失函数(对抗生成网络算法)

编辑:rootadmin
对抗生成网络(GAN)中的损失函数

目录

GAN的训练过程:

L1和L2损失函数的区别

基础概念

相同点

差异


GAN的训练过程:

推荐整理分享对抗生成网络(GAN)中的损失函数(对抗生成网络算法),希望有所帮助,仅作参考,欢迎阅读内容。

文章相关热门搜索词:对抗生成网络,对抗生成网络赵晶,对抗生成网络赵晶,对抗生成网络GAN,对抗生成网络GAN,对抗生成网络,对抗生成网络,对抗生成网络赵晶,内容如对您有帮助,希望把文章链接给更多的朋友!

1、先定义一个标签:real = 1,fake = 0。当然这两个值的维度是按照数据的输出来看的。再定义了两个优化器。用于生成器和判别器。

2、随机生成一个噪声z。将z作为生成器的输入,输出gen_imgs(假样本)。

3、计算生成器的损失

定义:生成器的损失为g_loss。损失函数为adverisal_loss()。判别器为discriminator()。g_loss = adverisal_loss(discriminator(gen_imgs), real)g_loss.backward()optimizer_G.step()

可以看出来,g_loss是根据一个输出(将生成的样本作为输入的判别器的输出)与real的一个损失。

1)discriminator(gen_imgs) 的输出是个什么? 既然是判别器,意思就是判别gen_imgs是不是真样本。如果是用softmax输出,是一个概率,为真样本的概率。

2)g_loss = adverisal_loss(discriminator(gen_imgs), real) 计算g_loss就是判别器的输出与real的差距,让g_loss越来越小,就是让gen_imgs作为判别器的输出的概率更接近valid。就是让gen_imgs更像真样本。

3)要注意的是,这个g_loss用于去更新了生成器的权重。这个时候,判别器的权重并没有被更新。

4、分别把假样本和真样本都送入到判别器。

real_loss = adverisal_loss(discriminator(real_imgs), real)fake_loss = adverisal_loss(discriminator(gen_imgs.detach()), fake)d_loss = (real_loss + fake_loss) / 2d_loss.backward()optimizer_D.step()

real_loss是判别器去判别真样本的输出,让这个输出更接近与real。

对抗生成网络(GAN)中的损失函数(对抗生成网络算法)

fake_loss是判别器去判别假样本的输出,让这个输出更接近与fake。

d_loss是前两者的平均。

损失函数向后传播,就是为了让d_loss ---> 0。也就是让:

real_loss ---> 0 ===> 让判别器的输出(真样本概率)接近 real

fake_loss ---> 0 ===> 让判别器的输出(假样本概率)接近 fake

也就是说,让判别器按照真假样本的类别,分别按照不同的要求去更新参数。

5、损失函数的走向?

g_loss 越小,说明生成器生产的假样本作为判别器的输入的输出(概率)越接近real,就是生成的假样本越像真样本。

d_loss越小,说明判别器越能够将识别出真样本和假样本。

所以,最后是要让g_loss更小,d_loss更接近0.5。以至于d_loss最后为0.5的时候,达到最好的效果。这个0.5的意思就是:判别器将真样本全部识别正确,所以real_loss=0。把所有的生成的假样本识别错误(生成的样本很真),此时fake_loss = 1。最后的d_loss = 1/2。

补充:

L1和L2损失函数的区别基础概念

    L1损失函数又称为MAE(mean abs error),即平均绝对误差,也就是预测值和真实值之间差值的绝对值。     L2损失函数又称为MSE(mean square error),即平均平方误差,也就是预测值和真实值之间差值的平方。

相同点

    因为计算的方式类似,只有一个平方的差异,因此使用的场合都很相近,通常用于回归任务中。

差异

    1)L2没有L1鲁棒,直观来说,L2会将误差平方,如果误差大于1,则误差会被放大很多,因此模型会对异常样本更敏感,这样会牺牲许多正常的样本。当训练集中含有更多异常值的时候,L1会更有效。     2)如果是图像重建任务,如超分辨率、深度估计、视频插帧等,L2会更加有效,这是由任务特性决定了,图像重建任务中通常预测值和真实值之间的差异不大,因此需要用L2损失来放大差异,进而指导模型的优化。     3)L1的问题在于它的梯度在极值点会发生跃变,并且很小的差异也会带来很大的梯度,不利于学习,因此在使用时通常会设定学习率衰减策略。而L2作为损失函数的时候本身由于其函数的特性,自身就会对梯度进行缩放,因此有的任务在使用L2时甚至不会调整学习率,不过随着现在的行业认知,学习率衰减策略在很多场景中依然是获得更优模型的手段。  

本文链接地址:https://www.jiuchutong.com/zhishi/297739.html 转载请保留说明!

上一篇:GRU时间序列数据分类预测(时间序列garch)

下一篇:【Linux】rm 命令:删除文件/文件夹(linux rm 命令)

  • 企业销售固定资产车辆怎么开票
  • 金税盘数据怎么备份
  • 缴纳个人所得税会计分录怎么写
  • 资产计提折旧的科目
  • 存货被盗的会计分录
  • 个税所得税清缴
  • 职工差旅费现金流出属于
  • 同一控制下企业合并取得的长期股权投资
  • 临时工工资为什么那么低?
  • 实际收到股票股利的分录
  • 由于红字发票生成红字进项税转出如何做账?
  • 工业总产值填报原则
  • 公司筹建期的个税怎么交
  • 资金印花税
  • 协会会费计入什么会计科目二级
  • gitlab lint
  • 怎么让资产负债率下降
  • 发票被盗丢失如何处理
  • 王者荣耀中甄姬的cp是谁
  • php上传大文件失败
  • php调用外部接口
  • 鸿蒙系统怎么去掉负一屏
  • 关闭系统自动调屏幕亮度
  • windows10和win10
  • php面向对象优点,缺点
  • 福利企业即征即退优惠政策
  • 存货周转材料报废处理会计分录
  • 广告费与业务宣传费扣除给企业带来的好处
  • 一般纳税人增值税优惠政策2023
  • Linux(CentOS)下PHP扩展PDO编译安装的方法
  • vue.js前端
  • 没有实收资本可以投资吗
  • php 数组
  • vi操作命令进入编辑命令
  • 购买房屋用于出租属于投资行为吗
  • 公司购买家电开什么发票
  • 固定资产租赁费的税率是多少
  • 给离职员工买社保的风险
  • 不良品扣款入什么科目
  • 专利银行汇款操作步骤
  • 财务报告与财务思维
  • sql2008怎么查询
  • PostgreSQL教程(十六):系统视图详解
  • mysql proxy问题的解决方法
  • 城建税退税流程
  • 客户货款打到私人微信,删除公司电脑数据
  • 借款费用为什么可以企业所得税税前扣除
  • 关联方交易金额达到多少算转移定价
  • 简易征收为什么要进项税转出呢
  • 社保费单位减免
  • 建筑劳务企业应发民工工资年终未发是否进行纳税调整
  • 公司股东投资是什么意思
  • 收到财付通的短信通知
  • 客户从公司借钱怎么拒绝
  • 收到政府土地补偿款账务处理
  • 计提坏账准备需要哪些资料
  • 两套账的会计被判刑吗
  • mysql怎么修改my.ini
  • WINDOWS操作系统属于单用户任务操作系统
  • xp系统鼠标设置在哪
  • linux终端基础命令
  • 制作win7系统安装u盘系统
  • wcu.exe是什么
  • win7系统升级到win10后,还能还原回来吗
  • xp系统如何设置用户密码
  • 新手怎么装
  • centos6.x下安装maven CentOS自动安装Maven的方法
  • win7系统局域网无法看到其他电脑
  • linux文件目录的含义
  • win7系统所有软件打不开
  • win 10电脑怎么调虚拟内存
  • unity加载gif
  • javascript高级程序设计电子版
  • shell脚本实际运用
  • js对象的常用方法
  • python flask框架 web服务器
  • 个人所得税工资扣税标准
  • 江西医保在线缴费
  • 外汇管理数字外管平台怎么登录
  • 湖南省地方税务局综合楼项目设计
  • 免责声明:网站部分图片文字素材来源于网络,如有侵权,请及时告知,我们会第一时间删除,谢谢! 邮箱:opceo@qq.com

    鄂ICP备2023003026号

    网站地图: 企业信息 工商信息 财税知识 网络常识 编程技术

    友情链接: 武汉网站建设