位置: IT常识 - 正文

一文总结图像生成必备经典模型(一)(图像的生成原理)

编辑:rootadmin
一文总结图像生成必备经典模型(一)

推荐整理分享一文总结图像生成必备经典模型(一)(图像的生成原理),希望有所帮助,仅作参考,欢迎阅读内容。

文章相关热门搜索词:图像的生与死,图像的生成原理,图像生成与图像处理,什么是图像生成,图像的生成原理,图像生产,图像的生与死,图像的生成原理,内容如对您有帮助,希望把文章链接给更多的朋友!

本文将分 2 期进行连载,共介绍 16 个在图像生成任务上曾取得 SOTA 的经典模型。

第 1 期:ProGAN、StyleGAN、StyleGAN2、StyleGAN3、VDVAE、NCP-VAE、StyleGAN-xl、Diffusion GAN

第 2 期:WGAN、SAGAN、BIG-GAN、CSGAN、LOGAN、UNet-GAN、IC-GAN、ADC-GAN

您正在阅读的是其中的第 1 期。前往 SOTA!模型资源站(sota.jiqizhixin.com)即可获取本文中包含的模型实现代码、预训练模型及 API 等资源。

本期收录模型速览

模型SOTA!模型资源站收录情况模型来源论文ProGANhttps://sota.jiqizhixin.com/project/0190e1fa-5643-4043-8b75-9b863a6d20db 收录实现数量:1 支持框架:TensorFlowProgressive Growing of GANs for Improved Quality, Stability, and VariationStyleGANhttps://sota.jiqizhixin.com/project/e072cfc0-26c3-40e7-a979-60df61170c7a 收录实现数量:75 支持框架:TensorFlow、PyTorchA Style-Based Generator Architecture for Generative Adversarial NetworksStyleGAN2https://sota.jiqizhixin.com/project/a07f5a80-bf97-4a33-a2a8-4ff938b1b82f 收录实现数量:1 支持框架:TensorFlowAnalyzing and Improving the Image Quality of StyleGANStyleGAN3https://sota.jiqizhixin.com/project/6f7d3d51-762a-4d23-a572-3ea79ab49b4f 收录实现数量:2 支持框架:TensorFlow、PyTorchAlias-Free Generative Adversarial NetworksVDVAEhttps://sota.jiqizhixin.com/project/0ed2229c-722b-47fb-b6aa-d22dedf87f1b 收录实现数量:1 支持框架:PyTorchVery Deep VAEs Generalize Autoregressive Models and Can Outperform Them on ImagesNCP-VAEhttps://sota.jiqizhixin.com/project/74d15cbe-7f75-434a-a1cf-a69ae303eec6A Contrastive Learning Approach for Training Variational Autoencoder PriorsStyleGAN-xlhttps://sota.jiqizhixin.com/project/01d16b00-e79f-4527-a7e3-08354b5d9b47 收录实现数量:1 支持框架:PyTorchStyleGAN-XL: Scaling StyleGAN to Large Diverse DatasetsDiffusion GANhttps://sota.jiqizhixin.com/project/9aa9b499-adec-46a3-aef9-4cd73e1c13ec 收录实现数量:1 支持框架:PyTorchDiffusion-GAN: Training GANs with Diffusion一文总结图像生成必备经典模型(一)(图像的生成原理)

生成模型是一种训练模型进行无监督学习的模型,即,给模型一组数据,希望从数据中学习到信息后的模型能够生成一组和训练集尽可能相近的数据。图像生成(Image generation,IG)则是指从现有数据集生成新的图像的任务。图像生成模型包括无条件生成和条件性生成两类,其中,无条件生成是指从数据集中无条件地生成样本,即p(y);条件性图像生成是指根据标签有条件地从数据集中生成样本,即p(y|x)。

图像生成也是深度学习模型应用比较广泛、研究程度比较深的一个主题,大量的图像库也为SOTA模型的训练和公布奠定了良好的基础。在几个著名的图像生成库中,例如CIFAR-10、ImageNet64、ImageNet32、STL-10、CelebA 256、CelebA64等等,目前公布出的最好的无条件生成模型有StyleGAN-XL、Diffusion ProjectedGAN;在ImageNet128、TinyImageNet、CIFAR10、CIFAR100等库中,效果最好的条件性生成模型则是LOGAN、ADC-GAN、StyleGAN2等。

 我们在这篇文章中介绍图像生成必备的TOP模型,从无条件生成模型和条件性生成模型两个类别分别介绍。图像生成模型的发展非常快,所以与其它几个topic不同,图像生成中必备的TOP模型介绍主要以近两年的SOTA模型为主。

一、无条件生成模型1.1 ProGAN

生成性对抗网络(GAN)是机器学习中一个相对较新的概念,于2014年首次引入。GAN的目标是合成与真实图像无法区分的人工样本,如图像。GAN的基本组成部分是两个神经网络:一个新样本的生成器(G),一个从训练数据和生成器输出中提取样本并预测它们是“真”还是“假”的鉴别器(D)。生成器的输入是一个随机向量(噪声),因此其初始输出也是噪声。随着训练的进行,当它收到鉴别器的反馈时,会学习合成更“真实”的图像。鉴别器还通过将生成的样本与真实样本进行比较,随着训练的进行不断改进,使得生成器更难欺骗它。

ProGAN是NVIDIA投稿ICLR 2018的一篇文章,ProGAN关键创新在于渐进式训练,它在经典GAN的基础上首先通过学习在低分辨率图像中也可以显示的基本特征,来创建图像的基本部分,并且随着分辨率的提高和时间的推移,学习越来越多的细节。低分辨率图像的训练不仅简单、快速,而且有助于更高级别的训练,因此,整体的训练也就更快。ProGAN被认为是后来大热的StyleGAN的前身。

图1 ProGAN架构

ProGAN的训练部分,从低分辨率的图像开始,通过向网络添加层来逐步提高分辨率,如图2所示。这种递增的性质允许训练首先发现图像分布的大规模结构,然后将注意力转移到越来越精细的细节上,而不是同时学习所有的尺度。使用生成器和鉴别器网络,它们是彼此的镜像,并且总是同步增长。在整个训练过程中,两个网络中的所有现有层都是可训练的。当新的层被添加到网络中时,平稳地将它们淡化,如图3所示。这就避免了对已经训练好的小分辨率层的突然冲击。

图2 训练开始时,生成器(G)和鉴别器(D)的空间分辨率都很低,只有4×4像素。随着训练的进行,逐步增加G和D的层数,从而提高生成图像的空间分辨率图3  当生成器(G)和鉴别器(D)的分辨率翻倍时,顺利地淡化新层。这个例子说明了从16×16图像(a)到32×32图像(c)的过渡。在过渡期间(b),把在更高的分辨率上操作的层当作一个残差块,其权重α从0到1线性增加

GAN还有一个问题是只捕捉训练数据中发现的变化的一个子集,mini-batch就是为了解决这个问题提出的,它是通过在鉴别器的末尾添加一个minibatch层来实现的,该层学习一个大的张量,将输入激活投射到一个统计数组。mini-batch中的每个样本都会产生一组单独的统计数据,并将其串联到该层的输出中,这样鉴别器就可以在内部使用这些统计数据。

ProGAN的简化方案既没有可学习的参数,也没有新的超参数,而是引入了特征的标准差作为衡量标准。首先计算每个特征在每个空间位置上的标准偏差。然后,在所有特征和空间位置上平均这些估计值,得到一个单一的值。复制这个值并将其连接到所有的空间位置和minibatch上,产生一个额外的(恒定)特征图。这一层可以插入鉴别器的任何地方,将其在最后插入效果最好。这个特征图中包含了不同样本之间的差异性信息,送入鉴别器后,经过训练,生成样本的差异性也会与训练样本的相似。

此外,ProGAN还对生成器和鉴别器进行了归一化处理,归一化主要是用来控制信号幅度,从而减少G与D之间的不正常竞争,沿channel维度对每个像素的特征长度归一化。minibatch statistic layer沿着batch维度求标准差,而它沿着channel维度求norm。

1.2 StyleGAN

转载于机器之心:ProGAN、StyleGAN、Diffusion GAN…你都掌握了吗?一文总结图像生成必备经典模型(一)

本文链接地址:https://www.jiuchutong.com/zhishi/295984.html 转载请保留说明!

上一篇:圣米歇尔山,法国诺曼底 (© DaLiu/Getty Images)(圣米歇尔山法语介)

下一篇:resnet(4)------全连接层与softmax(resnet+unet)

  • 天玑900怎么样(天玑900怎么样和骁龙695)

    天玑900怎么样(天玑900怎么样和骁龙695)

  • 抖音收藏和点赞有什么区别(抖音收藏和点赞哪个占内存)

    抖音收藏和点赞有什么区别(抖音收藏和点赞哪个占内存)

  • 华为8x怎么设置返回键(华为8x怎么设置门禁卡)

    华为8x怎么设置返回键(华为8x怎么设置门禁卡)

  • 拼多多发票怎么开(拼多多发票怎么删除)

    拼多多发票怎么开(拼多多发票怎么删除)

  • 闲鱼预留是什么意思(闲鱼上的预留是什么意思)

    闲鱼预留是什么意思(闲鱼上的预留是什么意思)

  • 按什么键可以复制整个屏幕(按什么键可以复制活动窗口)

    按什么键可以复制整个屏幕(按什么键可以复制活动窗口)

  • 打印图片时提示可用内存不足(打印图片时提示出现一个内部错误)

    打印图片时提示可用内存不足(打印图片时提示出现一个内部错误)

  • 锂电池充电器2a和3a的区别(锂电池充电器2a和3a换着充可以吗)

    锂电池充电器2a和3a的区别(锂电池充电器2a和3a换着充可以吗)

  • 手机钉钉怎么看直播(手机钉钉怎么看工资明细)

    手机钉钉怎么看直播(手机钉钉怎么看工资明细)

  • 录屏回放听不到对方的声音(录屏回放听不到对方的声音华为)

    录屏回放听不到对方的声音(录屏回放听不到对方的声音华为)

  • 苹果xs max屏幕失灵(iphone xs max手机屏幕失灵)

    苹果xs max屏幕失灵(iphone xs max手机屏幕失灵)

  • 手机软件更新在哪里(手机软件更新在哪里关闭的老是弹出来)

    手机软件更新在哪里(手机软件更新在哪里关闭的老是弹出来)

  • vivo手机nex3支持无线充电吗(vivo nex3支持nfc吗)

    vivo手机nex3支持无线充电吗(vivo nex3支持nfc吗)

  • 苹果airpodspro使用方法(airairpods pro使用)

    苹果airpodspro使用方法(airairpods pro使用)

  • 4g卡用5g手机流量怎么算(4g卡用5g手机流量)

    4g卡用5g手机流量怎么算(4g卡用5g手机流量)

  • 笔记本ss接口是什么(笔记本电脑ss接口没反应)

    笔记本ss接口是什么(笔记本电脑ss接口没反应)

  • 微博怎么获得铁粉头衔(微博怎么获得铁粉标)

    微博怎么获得铁粉头衔(微博怎么获得铁粉标)

  • 独显和主板怎么搭配(独立显卡与主板怎么连接)

    独显和主板怎么搭配(独立显卡与主板怎么连接)

  • word2003脚注怎么设置(word2019添加脚注)

    word2003脚注怎么设置(word2019添加脚注)

  • vivo手机储存卡在哪(vivo手机储存卡数据怎么恢复)

    vivo手机储存卡在哪(vivo手机储存卡数据怎么恢复)

  • 苹果x黑暗模式怎么设置(苹果x黑暗模式怎么解除)

    苹果x黑暗模式怎么设置(苹果x黑暗模式怎么解除)

  • 拼团购物是一人一份吗(拼团另一个人必须买吗)

    拼团购物是一人一份吗(拼团另一个人必须买吗)

  • 华为mate30怎么扫描(华为mate30怎么扫码连接wifi)

    华为mate30怎么扫描(华为mate30怎么扫码连接wifi)

  • 如何使用nfc坐地铁(如何使用nfc坐地铁刷卡)

    如何使用nfc坐地铁(如何使用nfc坐地铁刷卡)

  • oppo手机时间怎么显示横的(oppo手机时间怎么设置)

    oppo手机时间怎么显示横的(oppo手机时间怎么设置)

  • Javascript 基础知识学习(javascript入门基础)

    Javascript 基础知识学习(javascript入门基础)

  • 电子普通发票和纸质普通发票一样吗
  • 免税增值税的有哪几项
  • 赔偿费计入费用减应收账款怎么做账
  • 预交增值税设备租赁是否可抵扣
  • 购进财务软件折旧怎么算
  • 资产负债表的应付职工薪酬怎么填
  • 超过保质期存储时间或变质的食品应该怎样处理
  • 公司没有员工怎么零申报
  • 应交税费借方余额填列资产负债表
  • 劳务派遣一般纳税人可以简易征收吗
  • 股东垫支开办费
  • 需要会计报表的人
  • 项目顾问是什么意思
  • 银行收取年费是什么意思
  • 申报个税按计提工资还是实际发放
  • 房地产企业城市配套费
  • 小规纳税人租金可以记入成本吗
  • 溢价发行债券利息
  • 煤矿安全费用会议
  • 家具厂打磨工工作图片
  • 应付账款和应收票据区别
  • 有限公司股权怎么划分
  • win10怎么调出命令行窗口
  • 已经提完折旧的设备改造
  • iphone操作系统
  • 新的磁贴
  • mcshield.exe是什么进程
  • 公积金贷款所需手续
  • 最高像素的镜头是多少
  • 无私有住房证明怎么开
  • 商品流通企业库存商品的核算方法主要有
  • echartx轴刻度设置
  • spring integration使用:消息转换器
  • python如何编写函数
  • 捐赠收入要交所得税吗
  • 分公司能给总公司担保吗
  • 财务报表逾期了两个月有罚款吗
  • 26个字母!
  • 开具红字增值税专用发票信息表在哪
  • 税控盘 金税盘
  • 职工短期薪酬包括哪些
  • 综合所得减除费用标准为60000.00元/年
  • 汇算清缴利润调增70万会预警吗
  • 深圳市企业稳岗补贴标准
  • 工程外经证预缴税款计税方法
  • 纺织品业务
  • 营业执照备案登记表
  • 对于产品开发阶段的评价
  • 建筑公司项目如何上手
  • 企业所得税征前还是征后
  • 咨询费发票能抵扣吗
  • 营改增的服务
  • 出差补贴如何账务处理
  • 预付费用款项现金流量怎么算
  • 损益类账户属于资产还是负债
  • 替别人公司开发票违法吗
  • 经费收入经费支出怎样记账
  • 电汇凭证有效期
  • 货拉拉除了运费还要出钱吗
  • 租赁车子
  • 预收账款和应收账款可以放在一个账户
  • 简易征收是什么意思和一般纳税人
  • 国企背书是什么意思
  • ubuntu 管理软件
  • 联想Thinkpad怎么进入安全模式
  • 苹果mac电脑打不开
  • fedora怎么安装软件
  • 如何解决win10系统用户名有中文
  • 安装ubuntu后无法进入windows
  • 从此学会隐藏悲伤全文
  • win7升级win8.1失败
  • ghost详细说明
  • python如何精确小数
  • js限制数组长度
  • JavaScript中的复杂数据类型又称为
  • Node.js Mongodb 密码特殊字符 @的解决方法
  • 基于javascript的毕业设计
  • python九大特点
  • 房产税什么时候开始征收
  • 互联网新闻信息服务提供者为用户提供互联网新闻
  • 免责声明:网站部分图片文字素材来源于网络,如有侵权,请及时告知,我们会第一时间删除,谢谢! 邮箱:opceo@qq.com

    鄂ICP备2023003026号

    网站地图: 企业信息 工商信息 财税知识 网络常识 编程技术

    友情链接: 武汉网站建设