位置: IT常识 - 正文

私人定制AI绘画——快速finetune stable diffusion教程(私人定制ai绘画下载)

编辑:rootadmin
私人定制AI绘画——快速finetune stable diffusion教程

推荐整理分享私人定制AI绘画——快速finetune stable diffusion教程(私人定制ai绘画下载),希望有所帮助,仅作参考,欢迎阅读内容。

文章相关热门搜索词:私人定制图画,私人订制画室,私人订制手绘头像,私人订制画像,私人定制ai绘画下载,私人定制ai绘画软件,私人定制ai绘画软件,私人定制ai绘画下载,内容如对您有帮助,希望把文章链接给更多的朋友!

最近AI绘图非常火,只需要输入文本就能得到令人惊艳的图。

举个例子,输入 “photo of a gorgeous young woman in the style of stefan kostic and david la chapelle, coy, shy, alluring, evocative, stunning, award winning, realistic, sharp focus, 8 k high definition, 3 5 mm film photography, photo realistic, insanely detailed, intricate, elegant, art by stanley lau and artgerm”  得到:

输入“temple in ruines, forest, stairs, columns, cinematic, detailed, atmospheric, epic, concept art, Matte painting, background, mist, photo-realistic, concept art, volumetric light, cinematic epic + rule of thirds octane render, 8k, corona render, movie concept art, octane render, cinematic, trending on artstation, movie concept art, cinematic composition , ultra-detailed, realistic , hyper-realistic , volumetric lighting, 8k –ar 2:3 –test –uplight”  得到:

以上效果出自最近开源的效果非常好的模型——stable diffusion。那可能会有很多人和我一样,想得到自己的定制化的模型,专门用来生成人脸、动漫或者其他。

github上有个小哥还真就做了这件事了,他专门finetune了一个神奇宝贝版stable diffusion,以下是他模型的效果:     输入“robotic cat with wings”   得到:

是不是很有趣,今天这篇文章就介绍一下如何快速finetune stable diffusion。

小哥写的详细介绍可以移步:https://github.com/LambdaLabsML/examples/tree/main/stable-diffusion-finetuning

1、准备数据

私人定制AI绘画——快速finetune stable diffusion教程(私人定制ai绘画下载)

深度学习的训练,首先就是要解决数据问题。由于stable diffusion的训练数据是 文本-图像 匹配的pairs,因此我们要按照它的要求准备数据。

准备好你的所有图片,当然对于大部分人来说,要得到图片容易,但是手里的图片数据都是没有文本标注的,但是我们可以用BLIP算法来自动生成标注。

BLIP项目地址:https://github.com/salesforce/BLIP

效果见下图:

 BLIP自动给妙蛙种子生成了一段描述,当然算法的效果很难达到完美,但是足够用了。如果觉得不够好,那完全也可以自己标注。

将得到的text,与图片名使用json格式存起来:

{ "0001.jpg": "This is a young woman with a broad forehead.", "0002.jpg": "The young lady has a melon seed face and her chin is relatively narrow.", "0003.jpg": "This is a melon seed face woman who has a broad chin.There is a young lady with a broad forehead."}

2、下载代码模型

这里我们使用小哥魔改的stable diffusion代码,更加方便finetune。

finetune代码地址:https://github.com/justinpinkney/stable-diffusion

按照这个代码readme里的要求装好环境。同时下载好stable diffusion预训练好的模型 sd-v1-4-full-ema.ckpt ,放到目录里。

模型下载地址:CompVis/stable-diffusion-v-1-4-original · Hugging Face

3、配置与运行

stable diffusion使用yaml文件来配置训练,由于小哥给的yaml需要配置特定的数据格式,太麻烦了,我这边直接给出一个更简单方便的。只需要修改放图片的文件夹路径,以及第一步生成的配对数据的json文件路径。具体改哪儿直接看下面:

model: base_learning_rate: 1.0e-04 target: ldm.models.diffusion.ddpm.LatentDiffusion params: linear_start: 0.00085 linear_end: 0.0120 num_timesteps_cond: 1 log_every_t: 200 timesteps: 1000 first_stage_key: "image" cond_stage_key: "txt" image_size: 64 channels: 4 cond_stage_trainable: false # Note: different from the one we trained before conditioning_key: crossattn scale_factor: 0.18215 scheduler_config: # 10000 warmup steps target: ldm.lr_scheduler.LambdaLinearScheduler params: warm_up_steps: [ 1 ] # NOTE for resuming. use 10000 if starting from scratch cycle_lengths: [ 10000000000000 ] # incredibly large number to prevent corner cases f_start: [ 1.e-6 ] f_max: [ 1. ] f_min: [ 1. ] unet_config: target: ldm.modules.diffusionmodules.openaimodel.UNetModel params: image_size: 32 # unused in_channels: 4 out_channels: 4 model_channels: 320 attention_resolutions: [ 4, 2, 1 ] num_res_blocks: 2 channel_mult: [ 1, 2, 4, 4 ] num_heads: 8 use_spatial_transformer: True transformer_depth: 1 context_dim: 768 use_checkpoint: True legacy: False first_stage_config: target: ldm.models.autoencoder.AutoencoderKL ckpt_path: "models/first_stage_models/kl-f8/model.ckpt" params: embed_dim: 4 monitor: val/rec_loss ddconfig: double_z: true z_channels: 4 resolution: 256 in_channels: 3 out_ch: 3 ch: 128 ch_mult: - 1 - 2 - 4 - 4 num_res_blocks: 2 attn_resolutions: [] dropout: 0.0 lossconfig: target: torch.nn.Identity cond_stage_config: target: ldm.modules.encoders.modules.FrozenCLIPEmbedderdata: target: main.DataModuleFromConfig params: batch_size: 1 num_workers: 4 num_val_workers: 0 # Avoid a weird val dataloader issue train: target: ldm.data.simple.FolderData params: root_dir: '你存图片的文件夹路径/' caption_file: '图片对应的标注文件.json' image_transforms: - target: torchvision.transforms.Resize params: size: 512 interpolation: 3 - target: torchvision.transforms.RandomCrop params: size: 512 - target: torchvision.transforms.RandomHorizontalFlip validation: target: ldm.data.simple.TextOnly params: captions: - "测试时候用的prompt" - "A frontal selfie of handsome caucasian guy with blond hair and blue eyes, with face in the center" output_size: 512 n_gpus: 2 # small hack to sure we see all our sampleslightning: find_unused_parameters: False modelcheckpoint: params: every_n_train_steps: 30000 save_top_k: -1 monitor: null callbacks: image_logger: target: main.ImageLogger params: batch_frequency: 30000 max_images: 1 increase_log_steps: False log_first_step: True log_all_val: True log_images_kwargs: use_ema_scope: True inpaint: False plot_progressive_rows: False plot_diffusion_rows: False N: 4 unconditional_guidance_scale: 3.0 unconditional_guidance_label: [""] trainer: benchmark: True num_sanity_val_steps: 0 accumulate_grad_batches: 1

最后一步,运行命令:

python main.py --base yaml文件路径.yaml --gpus 0,1 --scale_lr False --num_nodes 1 --check_val_every_n_epoch 2 --finetune_from 上面下载的模型路径.ckpt

大功告成,等待模型训练就行了。需要注意的是,我这边启用了两个GPU,并且stable diffusion是比较吃显存的,我在V100上进行训练batchsize也只能设为1。

本文链接地址:https://www.jiuchutong.com/zhishi/300051.html 转载请保留说明!

上一篇:HTTP加密/HTTPS工作过程

下一篇:CSS网页布局(css网页布局代码)

  • 小爱和小度音箱对比(小爱和小度音箱哪个好)

    小爱和小度音箱对比(小爱和小度音箱哪个好)

  • i76700hq属于高端cpu吗(i7-6700hq什么级别)

    i76700hq属于高端cpu吗(i7-6700hq什么级别)

  • 看抖音不能横屏吗(抖音不能横屏吗)

    看抖音不能横屏吗(抖音不能横屏吗)

  • 腾讯课堂自己可以看时长吗(腾讯课堂可以直接进入吗)

    腾讯课堂自己可以看时长吗(腾讯课堂可以直接进入吗)

  • 防蓝光手机膜到底有没有用(防蓝光手机膜防摔吗)

    防蓝光手机膜到底有没有用(防蓝光手机膜防摔吗)

  • 苹果闹钟铃声改了还是默认的(苹果闹钟铃声改了却是原来的声音)

    苹果闹钟铃声改了还是默认的(苹果闹钟铃声改了却是原来的声音)

  • 5g出来了4g会变慢吗(5g出现以后4g还能用吗)

    5g出来了4g会变慢吗(5g出现以后4g还能用吗)

  • 怎么看抖音号注册时间(怎么看抖音号注销成功)

    怎么看抖音号注册时间(怎么看抖音号注销成功)

  • 华为平板能当电脑用吗(华为平板能当电子书使用吗)

    华为平板能当电脑用吗(华为平板能当电子书使用吗)

  • 苹果id都能查出什么(苹果id能查什么)

    苹果id都能查出什么(苹果id能查什么)

  • 主机有电却无法开机(有电但是电脑主机没反应怎么回事)

    主机有电却无法开机(有电但是电脑主机没反应怎么回事)

  • 苹果微信支付无效(苹果微信支付无效下载不了软件)

    苹果微信支付无效(苹果微信支付无效下载不了软件)

  • 小米mtd6是什么型号(小米型号mde6s是什么手机)

    小米mtd6是什么型号(小米型号mde6s是什么手机)

  • soul密友上线会提醒吗(soul密友上线会提醒对方吗隐身)

    soul密友上线会提醒吗(soul密友上线会提醒对方吗隐身)

  • 天猫精灵可以微信聊天吗(天猫精灵可以微信吗?)

    天猫精灵可以微信聊天吗(天猫精灵可以微信吗?)

  • 电脑启动不能进入系统(电脑启动不能进入桌面)

    电脑启动不能进入系统(电脑启动不能进入桌面)

  • 一加7T Pro怎么关闭振动(一加7pro如何关闭volte)

    一加7T Pro怎么关闭振动(一加7pro如何关闭volte)

  • a13比a12提升多少(a13比a12强多少对于普通人)

    a13比a12提升多少(a13比a12强多少对于普通人)

  • 苹果max壁纸比例怎么调(苹果max壁纸尺寸多少)

    苹果max壁纸比例怎么调(苹果max壁纸尺寸多少)

  • 小米8se怎么设置铃声(小米8se怎么设置门禁卡功能)

    小米8se怎么设置铃声(小米8se怎么设置门禁卡功能)

  • 嘀嗒拼车怎么评价车主(嘀嗒出行怎么评论)

    嘀嗒拼车怎么评价车主(嘀嗒出行怎么评论)

  • qq轻聊版如何退出(qq轻聊版怎么卸载)

    qq轻聊版如何退出(qq轻聊版怎么卸载)

  • 小米9有无线充电吗(小米9有无线充电功能吗怎么用)

    小米9有无线充电吗(小米9有无线充电功能吗怎么用)

  • 如何发布微信小程序体验版(如何发布微信小程序内容)

    如何发布微信小程序体验版(如何发布微信小程序内容)

  • 麦克米伦省级公园里的神殿林,加拿大不列颠哥伦比亚省 (© Robert Postma/Shutterstock)(麦克米伦anki)

    麦克米伦省级公园里的神殿林,加拿大不列颠哥伦比亚省 (© Robert Postma/Shutterstock)(麦克米伦anki)

  • 冰川国家公园中的佩里托莫雷诺冰川,阿根廷 (© Juergen Schonnop/Getty Images)(冰川国家公园在哪)

    冰川国家公园中的佩里托莫雷诺冰川,阿根廷 (© Juergen Schonnop/Getty Images)(冰川国家公园在哪)

  • 小规模纳税人企业所得税计算
  • 税务登记的期限为几年
  • 所得税率率
  • 一个月没有账务往来,现金日记账如何登记?
  • 差额征税劳务费发票
  • 营业外支出怎么结转本年利润
  • 预缴 汇算清缴
  • 直接计入当期损益的利得和损失,是指( )的利得或损失
  • 业务招待费列支内容
  • 固定资产账实不符的审计定性
  • 有形动产租赁简易征收适用哪些业务
  • 合伙企业的所得税政策
  • 分包业务的账务处理办法
  • 研发费用需要发什么科目
  • 停车场如何申领车牌号
  • 商贸企业仓储服务有哪些
  • 加工费计入什么费用
  • 开发转产品好转吗
  • 个人所得税成本费用怎么算
  • 10万以下免征增值税 文件
  • 卸载了驱动程序会怎么样
  • win7系统ie浏览器在哪里
  • 银行发放贷款银行会计怎么做账务处理
  • runservice.exe - runservice是什么进程 有什么用
  • win10提示病毒
  • 怎么提升电脑速度
  • 企业车间承包合同的法律效力
  • ctrl起什么作用
  • 分公司的股东怎么填
  • 通用数据库软件
  • php substr()
  • 委托代销商品的会计分录怎么做
  • 补提所得税费用可以直接计入当期
  • 关于商业承兑汇票的多选题有哪些
  • yii框架教程
  • audo命令
  • 违约赔偿金要交税吗
  • 怎么在网上增加办税人员
  • 转让使用过的固定资产增值税
  • 让渡资产使用权收入计入什么科目
  • 数据库维护工作主要包括哪些内容
  • 企业固定资产如何查询
  • 执行企业会计制度是什么意思
  • 家电销售的税率
  • 企业给员工的福利体检报告
  • 当月购入固定资产当月出售了用交印花税吗
  • 无形资产摊销账面价值
  • 外地预缴个人所得税凭证怎么弄
  • 子公司提的盈余公积合并时如何抵消
  • 无形资产根据什么科目填列
  • 企业未按照规定报送年度报告怎么办
  • 产品销售费用是什么科目
  • ubuntu怎么用
  • linux获取进程启动时间
  • fedora s7
  • vmware安装macos10.15
  • apache服务器配置与使用工作笔记
  • u盘做pe后还能存储吗
  • win8如何使用
  • win8设置无线网络
  • RedHatLinux AS3中APACHE+SendMail+OpenWebMail整合
  • Linux系统开源VPN Openvpn进程异常退出解决方法
  • linux查看nginx配置文件
  • js时间倒计时定时器怎么弄
  • 网页设计布局设计
  • unity调用c++封装的dll
  • bat批处理文件的语句
  • 用vue做项目加入购物车是怎么做到的
  • jQuery.datatables.js插件用法及api实例详解
  • javascript中函数
  • python 线程教程
  • jquery实现全选
  • react navigate
  • 高铁票抵扣进项能抵扣吗
  • 车辆缴纳购置税多少钱
  • 工程开具增值税专用发票
  • 湖北省地税局稽查局
  • 车辆购置税是国家收还是地方收
  • 安徽省滁州市税务局地址
  • 小微企业房产税优惠减免政策
  • 免责声明:网站部分图片文字素材来源于网络,如有侵权,请及时告知,我们会第一时间删除,谢谢! 邮箱:opceo@qq.com

    鄂ICP备2023003026号

    网站地图: 企业信息 工商信息 财税知识 网络常识 编程技术

    友情链接: 武汉网站建设