位置: IT常识 - 正文

私人定制AI绘画——快速finetune stable diffusion教程(私人定制ai绘画下载)

编辑:rootadmin
私人定制AI绘画——快速finetune stable diffusion教程

推荐整理分享私人定制AI绘画——快速finetune stable diffusion教程(私人定制ai绘画下载),希望有所帮助,仅作参考,欢迎阅读内容。

文章相关热门搜索词:私人定制图画,私人订制画室,私人订制手绘头像,私人订制画像,私人定制ai绘画下载,私人定制ai绘画软件,私人定制ai绘画软件,私人定制ai绘画下载,内容如对您有帮助,希望把文章链接给更多的朋友!

最近AI绘图非常火,只需要输入文本就能得到令人惊艳的图。

举个例子,输入 “photo of a gorgeous young woman in the style of stefan kostic and david la chapelle, coy, shy, alluring, evocative, stunning, award winning, realistic, sharp focus, 8 k high definition, 3 5 mm film photography, photo realistic, insanely detailed, intricate, elegant, art by stanley lau and artgerm”  得到:

输入“temple in ruines, forest, stairs, columns, cinematic, detailed, atmospheric, epic, concept art, Matte painting, background, mist, photo-realistic, concept art, volumetric light, cinematic epic + rule of thirds octane render, 8k, corona render, movie concept art, octane render, cinematic, trending on artstation, movie concept art, cinematic composition , ultra-detailed, realistic , hyper-realistic , volumetric lighting, 8k –ar 2:3 –test –uplight”  得到:

以上效果出自最近开源的效果非常好的模型——stable diffusion。那可能会有很多人和我一样,想得到自己的定制化的模型,专门用来生成人脸、动漫或者其他。

github上有个小哥还真就做了这件事了,他专门finetune了一个神奇宝贝版stable diffusion,以下是他模型的效果:     输入“robotic cat with wings”   得到:

是不是很有趣,今天这篇文章就介绍一下如何快速finetune stable diffusion。

小哥写的详细介绍可以移步:https://github.com/LambdaLabsML/examples/tree/main/stable-diffusion-finetuning

1、准备数据

私人定制AI绘画——快速finetune stable diffusion教程(私人定制ai绘画下载)

深度学习的训练,首先就是要解决数据问题。由于stable diffusion的训练数据是 文本-图像 匹配的pairs,因此我们要按照它的要求准备数据。

准备好你的所有图片,当然对于大部分人来说,要得到图片容易,但是手里的图片数据都是没有文本标注的,但是我们可以用BLIP算法来自动生成标注。

BLIP项目地址:https://github.com/salesforce/BLIP

效果见下图:

 BLIP自动给妙蛙种子生成了一段描述,当然算法的效果很难达到完美,但是足够用了。如果觉得不够好,那完全也可以自己标注。

将得到的text,与图片名使用json格式存起来:

{ "0001.jpg": "This is a young woman with a broad forehead.", "0002.jpg": "The young lady has a melon seed face and her chin is relatively narrow.", "0003.jpg": "This is a melon seed face woman who has a broad chin.There is a young lady with a broad forehead."}

2、下载代码模型

这里我们使用小哥魔改的stable diffusion代码,更加方便finetune。

finetune代码地址:https://github.com/justinpinkney/stable-diffusion

按照这个代码readme里的要求装好环境。同时下载好stable diffusion预训练好的模型 sd-v1-4-full-ema.ckpt ,放到目录里。

模型下载地址:CompVis/stable-diffusion-v-1-4-original · Hugging Face

3、配置与运行

stable diffusion使用yaml文件来配置训练,由于小哥给的yaml需要配置特定的数据格式,太麻烦了,我这边直接给出一个更简单方便的。只需要修改放图片的文件夹路径,以及第一步生成的配对数据的json文件路径。具体改哪儿直接看下面:

model: base_learning_rate: 1.0e-04 target: ldm.models.diffusion.ddpm.LatentDiffusion params: linear_start: 0.00085 linear_end: 0.0120 num_timesteps_cond: 1 log_every_t: 200 timesteps: 1000 first_stage_key: "image" cond_stage_key: "txt" image_size: 64 channels: 4 cond_stage_trainable: false # Note: different from the one we trained before conditioning_key: crossattn scale_factor: 0.18215 scheduler_config: # 10000 warmup steps target: ldm.lr_scheduler.LambdaLinearScheduler params: warm_up_steps: [ 1 ] # NOTE for resuming. use 10000 if starting from scratch cycle_lengths: [ 10000000000000 ] # incredibly large number to prevent corner cases f_start: [ 1.e-6 ] f_max: [ 1. ] f_min: [ 1. ] unet_config: target: ldm.modules.diffusionmodules.openaimodel.UNetModel params: image_size: 32 # unused in_channels: 4 out_channels: 4 model_channels: 320 attention_resolutions: [ 4, 2, 1 ] num_res_blocks: 2 channel_mult: [ 1, 2, 4, 4 ] num_heads: 8 use_spatial_transformer: True transformer_depth: 1 context_dim: 768 use_checkpoint: True legacy: False first_stage_config: target: ldm.models.autoencoder.AutoencoderKL ckpt_path: "models/first_stage_models/kl-f8/model.ckpt" params: embed_dim: 4 monitor: val/rec_loss ddconfig: double_z: true z_channels: 4 resolution: 256 in_channels: 3 out_ch: 3 ch: 128 ch_mult: - 1 - 2 - 4 - 4 num_res_blocks: 2 attn_resolutions: [] dropout: 0.0 lossconfig: target: torch.nn.Identity cond_stage_config: target: ldm.modules.encoders.modules.FrozenCLIPEmbedderdata: target: main.DataModuleFromConfig params: batch_size: 1 num_workers: 4 num_val_workers: 0 # Avoid a weird val dataloader issue train: target: ldm.data.simple.FolderData params: root_dir: '你存图片的文件夹路径/' caption_file: '图片对应的标注文件.json' image_transforms: - target: torchvision.transforms.Resize params: size: 512 interpolation: 3 - target: torchvision.transforms.RandomCrop params: size: 512 - target: torchvision.transforms.RandomHorizontalFlip validation: target: ldm.data.simple.TextOnly params: captions: - "测试时候用的prompt" - "A frontal selfie of handsome caucasian guy with blond hair and blue eyes, with face in the center" output_size: 512 n_gpus: 2 # small hack to sure we see all our sampleslightning: find_unused_parameters: False modelcheckpoint: params: every_n_train_steps: 30000 save_top_k: -1 monitor: null callbacks: image_logger: target: main.ImageLogger params: batch_frequency: 30000 max_images: 1 increase_log_steps: False log_first_step: True log_all_val: True log_images_kwargs: use_ema_scope: True inpaint: False plot_progressive_rows: False plot_diffusion_rows: False N: 4 unconditional_guidance_scale: 3.0 unconditional_guidance_label: [""] trainer: benchmark: True num_sanity_val_steps: 0 accumulate_grad_batches: 1

最后一步,运行命令:

python main.py --base yaml文件路径.yaml --gpus 0,1 --scale_lr False --num_nodes 1 --check_val_every_n_epoch 2 --finetune_from 上面下载的模型路径.ckpt

大功告成,等待模型训练就行了。需要注意的是,我这边启用了两个GPU,并且stable diffusion是比较吃显存的,我在V100上进行训练batchsize也只能设为1。

本文链接地址:https://www.jiuchutong.com/zhishi/300051.html 转载请保留说明!

上一篇:HTTP加密/HTTPS工作过程

下一篇:CSS网页布局(css网页布局代码)

  • 博客推广流程(博客推广要钱吗)

    博客推广流程(博客推广要钱吗)

  • 小米手机两张截图如何并列放在一起(小米手机两张截图怎么拼成一张图)

    小米手机两张截图如何并列放在一起(小米手机两张截图怎么拼成一张图)

  • 朋友圈怎么设置不提醒功能(朋友圈怎么设置一个月可见)

    朋友圈怎么设置不提醒功能(朋友圈怎么设置一个月可见)

  • 苹果x防水吗(苹果xsmax防水吗)

    苹果x防水吗(苹果xsmax防水吗)

  • 华为手机强制开机按什么键(华为手机强制开机没反应)

    华为手机强制开机按什么键(华为手机强制开机没反应)

  • Word加号怎么打出来(word怎么打加号或者减号)

    Word加号怎么打出来(word怎么打加号或者减号)

  • b站app怎么下载(b站旧版本下载)

    b站app怎么下载(b站旧版本下载)

  • 美团跑腿新客红包怎么用(美团跑腿新客红包怎么领)

    美团跑腿新客红包怎么用(美团跑腿新客红包怎么领)

  • iphonexrhome键怎么设置(苹果xr调出home键)

    iphonexrhome键怎么设置(苹果xr调出home键)

  • 照片怎么弄成pdf格式?(证书照片怎么弄成pdf)

    照片怎么弄成pdf格式?(证书照片怎么弄成pdf)

  • 文件不小心替换能恢复吗(文件不小心替换了还能恢复吗)

    文件不小心替换能恢复吗(文件不小心替换了还能恢复吗)

  • 为什么别人能看到我抖音在线(为什么别人能看到我的微信聊天记录)

    为什么别人能看到我抖音在线(为什么别人能看到我的微信聊天记录)

  • word普通视图在哪

    word普通视图在哪

  • kindle是什么东西(kindle多少钱一台)

    kindle是什么东西(kindle多少钱一台)

  • 如何删除word里的空白页(如何删除word里面的标记)

    如何删除word里的空白页(如何删除word里面的标记)

  • 华为mate x 发售时间

    华为mate x 发售时间

  • 微信删除好友后怎么恢复聊天记录(微信删除好友后还能找到聊天记录吗)

    微信删除好友后怎么恢复聊天记录(微信删除好友后还能找到聊天记录吗)

  • 笔记本2060和2070mq差距大吗(笔记本2060和2070的差距)

    笔记本2060和2070mq差距大吗(笔记本2060和2070的差距)

  • b站审核为什么这么慢(b站审核为什么这么难过)

    b站审核为什么这么慢(b站审核为什么这么难过)

  • 苹果手机以前的视频怎么播放不出来了(苹果手机以前的通话记录怎么查)

    苹果手机以前的视频怎么播放不出来了(苹果手机以前的通话记录怎么查)

  • 苹果x怎样阻止陌生来电(苹果x如何阻止陌生电话)

    苹果x怎样阻止陌生来电(苹果x如何阻止陌生电话)

  • ipadair3可以用第几代笔(ipadair第三代可以用笔吗)

    ipadair3可以用第几代笔(ipadair第三代可以用笔吗)

  • 华为为什么门禁卡模拟了但是用不了(华为为什么门禁卡模拟了但是读卡失败)

    华为为什么门禁卡模拟了但是用不了(华为为什么门禁卡模拟了但是读卡失败)

  • iphone保修政策(苹果保修政策2020)

    iphone保修政策(苹果保修政策2020)

  • 天猫精灵怎么连接网络(天猫精灵怎么连接蓝牙)

    天猫精灵怎么连接网络(天猫精灵怎么连接蓝牙)

  • 华为mate30支持wifi6吗(华为mate30支持wifi5g吗)

    华为mate30支持wifi6吗(华为mate30支持wifi5g吗)

  • 视频会议系统的主要功能

    视频会议系统的主要功能

  • 华为nova5语音助手(华为nova5z智能语音)

    华为nova5语音助手(华为nova5z智能语音)

  • mate20开发者选项在哪里(mate20开发者选项在哪 无法打开)

    mate20开发者选项在哪里(mate20开发者选项在哪 无法打开)

  • 分期乐怎么微信认证(分期乐怎么微信提前还款)

    分期乐怎么微信认证(分期乐怎么微信提前还款)

  • 行政事业性收据发票记帐
  • 增值税应纳税额是什么意思
  • 股份有限公司董事会决议必须经过
  • 加计抵减不符合怎么办
  • 处置固定资产增值税税率
  • 展览服务费进项可以抵扣吗
  • 营业外收入是否属于当期损益
  • 再保后赔款支出
  • 负债与递延收益的区别
  • 公司交的拍卖费计入哪个会计科目?
  • 销售安装门窗增值税
  • 小规模附征税减半吗亲
  • 哪些情况下超市销售发霉食品免责
  • 超过认证期限的发票还能认证吗
  • 非贸易企业代扣代缴增值税和附加税如何做账?
  • 联想旧电脑怎么连接wifi
  • 阻止系统蓝屏后怎么恢复
  • 去年的季度所得税额怎么做账
  • 其他债权投资期末公允价值的变动应当计入
  • 研发阶段产品销售账务处理
  • 预测“叫停GPT-4后续AI大模型”后续:这是一个囚徒困境
  • php数组查找
  • 税控盘抵减
  • 个人非货币性资产投资个人所得税
  • PHP:curl_multi_select()的用法_cURL函数
  • nvidia gpu系列
  • rteng7.exe - rteng7是什么进程 有什么用
  • 售后回购不符合法律规定
  • 个体工商户筹集资金的难易程度
  • 原材料结转成本有几种方法
  • 取得海关专用缴款书的会计分录
  • php下载文件夹
  • django pypi
  • php字符串定义
  • 序列标注技术应用
  • 杀疯了出自哪里
  • elementui的表格
  • 顺丰快递电子运单打印模板
  • 生产车间年终奖计入什么科目
  • 织梦系统
  • 累计折旧怎么做账
  • 无形资产入账价值错误怎么调
  • 经审计的财务报表是否要会计师事务所盖章
  • sqlserver数据库版本号怎么查
  • 以销售额和年末存货计算的存货周转率公式
  • 增值税勾选统计后如何导出明细表
  • 可供出售金融资产属于什么科目
  • 企业给员工的福利体检报告
  • 结构性存款是什么意思是理财
  • 混合销售举例说明
  • 退回工伤保险的现金流
  • 应付账款的逾期利息计入什么科目
  • 固定资产多入账怎么写情况说明
  • 新政府会计固定资产的核算与计量
  • 一次性伤残就业补助金怎么领取
  • 收到车辆购置税发票怎么做账
  • 企业办理土地证需要哪些资料
  • 会计一般用什么软件
  • 公司无形资产可以作为公司注册资金吗
  • linux怎么禁用防火墙
  • vmware下ubuntu(linux)与主机文件共享设置的方法
  • solaris8+apache2+weblogic813+db2_82客户端+128 安装过程
  • win7的开始菜单在哪里
  • centos的特点
  • mcshield.exe是什么进程
  • wrme.exe是什么
  • linux系统基本操作命令
  • win10里的运行
  • nodejs 用途
  • AsyncTask onPostExecute()不执行,与JPush冲突
  • node 执行js
  • java多线程用法
  • linux修改目录路径
  • javascript 继承
  • jQuery Ajax传值到Servlet出现乱码问题的解决方法
  • div.remove
  • 黑马程序员培训怎样
  • 土地闲置是否需要缴纳土地使用税
  • 深圳营业执照办理咨询电话
  • 契税完税证明遗失
  • 免责声明:网站部分图片文字素材来源于网络,如有侵权,请及时告知,我们会第一时间删除,谢谢! 邮箱:opceo@qq.com

    鄂ICP备2023003026号

    网站地图: 企业信息 工商信息 财税知识 网络常识 编程技术

    友情链接: 武汉网站建设