位置: IT常识 - 正文

私人定制AI绘画——快速finetune stable diffusion教程(私人定制ai绘画下载)

编辑:rootadmin
私人定制AI绘画——快速finetune stable diffusion教程

推荐整理分享私人定制AI绘画——快速finetune stable diffusion教程(私人定制ai绘画下载),希望有所帮助,仅作参考,欢迎阅读内容。

文章相关热门搜索词:私人定制图画,私人订制画室,私人订制手绘头像,私人订制画像,私人定制ai绘画下载,私人定制ai绘画软件,私人定制ai绘画软件,私人定制ai绘画下载,内容如对您有帮助,希望把文章链接给更多的朋友!

最近AI绘图非常火,只需要输入文本就能得到令人惊艳的图。

举个例子,输入 “photo of a gorgeous young woman in the style of stefan kostic and david la chapelle, coy, shy, alluring, evocative, stunning, award winning, realistic, sharp focus, 8 k high definition, 3 5 mm film photography, photo realistic, insanely detailed, intricate, elegant, art by stanley lau and artgerm”  得到:

输入“temple in ruines, forest, stairs, columns, cinematic, detailed, atmospheric, epic, concept art, Matte painting, background, mist, photo-realistic, concept art, volumetric light, cinematic epic + rule of thirds octane render, 8k, corona render, movie concept art, octane render, cinematic, trending on artstation, movie concept art, cinematic composition , ultra-detailed, realistic , hyper-realistic , volumetric lighting, 8k –ar 2:3 –test –uplight”  得到:

以上效果出自最近开源的效果非常好的模型——stable diffusion。那可能会有很多人和我一样,想得到自己的定制化的模型,专门用来生成人脸、动漫或者其他。

github上有个小哥还真就做了这件事了,他专门finetune了一个神奇宝贝版stable diffusion,以下是他模型的效果:     输入“robotic cat with wings”   得到:

是不是很有趣,今天这篇文章就介绍一下如何快速finetune stable diffusion。

小哥写的详细介绍可以移步:https://github.com/LambdaLabsML/examples/tree/main/stable-diffusion-finetuning

1、准备数据

私人定制AI绘画——快速finetune stable diffusion教程(私人定制ai绘画下载)

深度学习的训练,首先就是要解决数据问题。由于stable diffusion的训练数据是 文本-图像 匹配的pairs,因此我们要按照它的要求准备数据。

准备好你的所有图片,当然对于大部分人来说,要得到图片容易,但是手里的图片数据都是没有文本标注的,但是我们可以用BLIP算法来自动生成标注。

BLIP项目地址:https://github.com/salesforce/BLIP

效果见下图:

 BLIP自动给妙蛙种子生成了一段描述,当然算法的效果很难达到完美,但是足够用了。如果觉得不够好,那完全也可以自己标注。

将得到的text,与图片名使用json格式存起来:

{ "0001.jpg": "This is a young woman with a broad forehead.", "0002.jpg": "The young lady has a melon seed face and her chin is relatively narrow.", "0003.jpg": "This is a melon seed face woman who has a broad chin.There is a young lady with a broad forehead."}

2、下载代码模型

这里我们使用小哥魔改的stable diffusion代码,更加方便finetune。

finetune代码地址:https://github.com/justinpinkney/stable-diffusion

按照这个代码readme里的要求装好环境。同时下载好stable diffusion预训练好的模型 sd-v1-4-full-ema.ckpt ,放到目录里。

模型下载地址:CompVis/stable-diffusion-v-1-4-original · Hugging Face

3、配置与运行

stable diffusion使用yaml文件来配置训练,由于小哥给的yaml需要配置特定的数据格式,太麻烦了,我这边直接给出一个更简单方便的。只需要修改放图片的文件夹路径,以及第一步生成的配对数据的json文件路径。具体改哪儿直接看下面:

model: base_learning_rate: 1.0e-04 target: ldm.models.diffusion.ddpm.LatentDiffusion params: linear_start: 0.00085 linear_end: 0.0120 num_timesteps_cond: 1 log_every_t: 200 timesteps: 1000 first_stage_key: "image" cond_stage_key: "txt" image_size: 64 channels: 4 cond_stage_trainable: false # Note: different from the one we trained before conditioning_key: crossattn scale_factor: 0.18215 scheduler_config: # 10000 warmup steps target: ldm.lr_scheduler.LambdaLinearScheduler params: warm_up_steps: [ 1 ] # NOTE for resuming. use 10000 if starting from scratch cycle_lengths: [ 10000000000000 ] # incredibly large number to prevent corner cases f_start: [ 1.e-6 ] f_max: [ 1. ] f_min: [ 1. ] unet_config: target: ldm.modules.diffusionmodules.openaimodel.UNetModel params: image_size: 32 # unused in_channels: 4 out_channels: 4 model_channels: 320 attention_resolutions: [ 4, 2, 1 ] num_res_blocks: 2 channel_mult: [ 1, 2, 4, 4 ] num_heads: 8 use_spatial_transformer: True transformer_depth: 1 context_dim: 768 use_checkpoint: True legacy: False first_stage_config: target: ldm.models.autoencoder.AutoencoderKL ckpt_path: "models/first_stage_models/kl-f8/model.ckpt" params: embed_dim: 4 monitor: val/rec_loss ddconfig: double_z: true z_channels: 4 resolution: 256 in_channels: 3 out_ch: 3 ch: 128 ch_mult: - 1 - 2 - 4 - 4 num_res_blocks: 2 attn_resolutions: [] dropout: 0.0 lossconfig: target: torch.nn.Identity cond_stage_config: target: ldm.modules.encoders.modules.FrozenCLIPEmbedderdata: target: main.DataModuleFromConfig params: batch_size: 1 num_workers: 4 num_val_workers: 0 # Avoid a weird val dataloader issue train: target: ldm.data.simple.FolderData params: root_dir: '你存图片的文件夹路径/' caption_file: '图片对应的标注文件.json' image_transforms: - target: torchvision.transforms.Resize params: size: 512 interpolation: 3 - target: torchvision.transforms.RandomCrop params: size: 512 - target: torchvision.transforms.RandomHorizontalFlip validation: target: ldm.data.simple.TextOnly params: captions: - "测试时候用的prompt" - "A frontal selfie of handsome caucasian guy with blond hair and blue eyes, with face in the center" output_size: 512 n_gpus: 2 # small hack to sure we see all our sampleslightning: find_unused_parameters: False modelcheckpoint: params: every_n_train_steps: 30000 save_top_k: -1 monitor: null callbacks: image_logger: target: main.ImageLogger params: batch_frequency: 30000 max_images: 1 increase_log_steps: False log_first_step: True log_all_val: True log_images_kwargs: use_ema_scope: True inpaint: False plot_progressive_rows: False plot_diffusion_rows: False N: 4 unconditional_guidance_scale: 3.0 unconditional_guidance_label: [""] trainer: benchmark: True num_sanity_val_steps: 0 accumulate_grad_batches: 1

最后一步,运行命令:

python main.py --base yaml文件路径.yaml --gpus 0,1 --scale_lr False --num_nodes 1 --check_val_every_n_epoch 2 --finetune_from 上面下载的模型路径.ckpt

大功告成,等待模型训练就行了。需要注意的是,我这边启用了两个GPU,并且stable diffusion是比较吃显存的,我在V100上进行训练batchsize也只能设为1。

本文链接地址:https://www.jiuchutong.com/zhishi/300051.html 转载请保留说明!

上一篇:HTTP加密/HTTPS工作过程

下一篇:CSS网页布局(css网页布局代码)

  • 荣耀magic3怎么设置省电(荣耀magic3怎么设置桌面时间和天气)

    荣耀magic3怎么设置省电(荣耀magic3怎么设置桌面时间和天气)

  • 苹果13怎么锁屏(苹果13怎么锁屏录视频)

    苹果13怎么锁屏(苹果13怎么锁屏录视频)

  • 饿了么没人接单怎么处理(饿了么没人接单会强制骑手配送吗)

    饿了么没人接单怎么处理(饿了么没人接单会强制骑手配送吗)

  • vivo NEX 3s是不是曲面屏手机吗(vivonex3s是不是双模5g)

    vivo NEX 3s是不是曲面屏手机吗(vivonex3s是不是双模5g)

  • 多个路由器连接怎么设置不会冲突(多个路由器连接方法)

    多个路由器连接怎么设置不会冲突(多个路由器连接方法)

  • 电脑内存不够买什么盘(电脑内存不够买u盘有用吗)

    电脑内存不够买什么盘(电脑内存不够买u盘有用吗)

  • se什么时候上市的(荣耀60se什么时候上市)

    se什么时候上市的(荣耀60se什么时候上市)

  • qq动态怎么从九宫格变成横排(qq动态怎么变成九宫格)

    qq动态怎么从九宫格变成横排(qq动态怎么变成九宫格)

  • 华为手机一直显示耳机模式怎么回事(华为手机一直显示红色闪电开不了机)

    华为手机一直显示耳机模式怎么回事(华为手机一直显示红色闪电开不了机)

  • 探探怎么知道对方有没有解除配对吗(探探怎么知道对方把你拉黑了)

    探探怎么知道对方有没有解除配对吗(探探怎么知道对方把你拉黑了)

  • 局域网lan是指在什么范围内的网络(局域网lan所采用的传输方式为( ))

    局域网lan是指在什么范围内的网络(局域网lan所采用的传输方式为( ))

  • 荣耀20s支持息屏显示吗(华为荣耀20s有没有灭屏显示)

    荣耀20s支持息屏显示吗(华为荣耀20s有没有灭屏显示)

  • 苹果耳机购买日期未验证是什么意思(苹果耳机购买日期)

    苹果耳机购买日期未验证是什么意思(苹果耳机购买日期)

  • qq扩列聊天匹配失败(qq扩列匹配功能)

    qq扩列聊天匹配失败(qq扩列匹配功能)

  • 优酷可以一起看电影吗(优酷网在线观看)

    优酷可以一起看电影吗(优酷网在线观看)

  • qq群直播间别人能看见我吗(qq群直播间别人看得到吗)

    qq群直播间别人能看见我吗(qq群直播间别人看得到吗)

  • 手机换屏后黑屏的原因(手机换屏后黑屏打不开)

    手机换屏后黑屏的原因(手机换屏后黑屏打不开)

  • 苹果x合约机划算吗(苹果x合约机什么意思)

    苹果x合约机划算吗(苹果x合约机什么意思)

  • 锁屏样式怎么自定义(锁屏样式怎么换成自己保存的图片)

    锁屏样式怎么自定义(锁屏样式怎么换成自己保存的图片)

  • 二维码容量大小极限(二维码容量大小怎么看)

    二维码容量大小极限(二维码容量大小怎么看)

  • 解压专家怎么用(苹果解压专家怎么用)

    解压专家怎么用(苹果解压专家怎么用)

  • 华为手机本地视频播放设置在哪里(华为手机本地视频设置动态壁纸)

    华为手机本地视频播放设置在哪里(华为手机本地视频设置动态壁纸)

  • 小米蓝牙耳机支持ldac吗(小米蓝牙耳机支持快充吗)

    小米蓝牙耳机支持ldac吗(小米蓝牙耳机支持快充吗)

  • ai智能机器人怎么连网(ai智能机器人怎么联网)

    ai智能机器人怎么连网(ai智能机器人怎么联网)

  • 小米画报在哪里(小米画报在哪里订阅)

    小米画报在哪里(小米画报在哪里订阅)

  • 华为mate50耳机孔位置(华为mate50耳机孔和充电口一样吗)

    华为mate50耳机孔位置(华为mate50耳机孔和充电口一样吗)

  • 研发销售型企业
  • 自有住房出租
  • 应付账款支付时需要付款申请单吗
  • 增值税小规模纳税人认定标准
  • 宁波财税网会计招聘
  • 预计净残值的计算公式为
  • 预付和预收可以合并吗
  • 政府补贴是否要交企业所得税
  • 自然人独资企业股东承担连带责任
  • 新成立公司申报流程
  • 私人网银可以转到对公账户吗?
  • 注册资本金实缴和认缴区别
  • 保证金可以挪用吗
  • 税务局代开的进项票需要认证吗
  • 如何认定纳税人资格证书
  • 房地产企业进项税额转出
  • 冲减预提费用
  • 为什么企业要预缴增值税
  • 增值税发票过期了税金怎么办
  • 增值税专用发票验票
  • 国税局公告2020年1号
  • 税务改革方向
  • 对员工的罚款怎么做账
  • 广告公司固定资产有哪些?
  • 个体户没有对公账户可以转个人账户吗
  • 小规模销项负数发票怎么做账
  • 员工给公司代垫的款项分录
  • linux默认文件类型
  • 王者荣耀英雄印花衣服哪里批发
  • 企业预缴电费会退回吗
  • php中数组的常用函数及用法
  • 域名停靠是病毒吗
  • 新版mac如何连接iphone
  • win7系统不可用怎么办
  • mac清理垃圾怎么清理
  • 运输取得的收入
  • 生产企业出口退税全部流程
  • 二手车过户需要带什么资料
  • php java c#
  • framework4.0怎么打开
  • 快速搞懂Pinia及数据持久化存储(详细教程)
  • php cookies
  • 劳务派遣怎么开
  • 销售折让怎么核算成本
  • 公司股票买卖账务处理
  • php获取参数值的三种方式
  • 企业出租专利技术收取的租金不得确认为收入对吗
  • 一般纳税人适用3%税率情况
  • 给客户退款怎么说
  • 城建税减半从什么时候开始
  • 房租预付款会计分录
  • 财付通支付的优缺点
  • 软件购买商城
  • 建筑工程社会实践报告
  • 应收股利在资产负债表中怎么填
  • 原始凭证分类的依据有什么
  • 小规模纳税人计算公式
  • 企业超过一定金额采购需求
  • mysql输入密码命令
  • MySQL 5.6.36 Windows x64位版本的安装教程详解
  • 忘记密码 ?
  • RunClubSanDisk.exe是什么程序? 闪迪U盘广告推介程序
  • win7系统怎么设置微信多开
  • linux设置用户的密码
  • dgservice.exe是什么
  • 安装完win8后没有无线网络
  • centos删除vg
  • mac火狐浏览器flash插件设置
  • centos bz
  • win8双系统安装教程
  • cocos2d
  • javascript判断语句
  • ftp自动上传脚本怎么用
  • [置顶]bilinovel
  • linux查看远程服务是否开启
  • jquery技巧
  • JavaScript中setMonth()方法的使用详解
  • jquery 遍历
  • 江苏省国家税务局发票查询
  • 小规模纳税人需要建账吗
  • 免责声明:网站部分图片文字素材来源于网络,如有侵权,请及时告知,我们会第一时间删除,谢谢! 邮箱:opceo@qq.com

    鄂ICP备2023003026号

    网站地图: 企业信息 工商信息 财税知识 网络常识 编程技术

    友情链接: 武汉网站建设