位置: IT常识 - 正文

【论文精读】Tune-A-Video: One-Shot Tuning of Image Diffusion Models for Text-to-Video Generation(论文精读分析报告)

编辑:rootadmin
【论文精读】Tune-A-Video: One-Shot Tuning of Image Diffusion Models for Text-to-Video Generation Tune-A-Video: One-Shot Tuning of Image Diffusion Models for Text-to-Video Generationvideo-to-videoAbstractIntroductionMethodDiffusion ModelsLatent Diffusion ModelOne-shot Video GenerationOur Tune-A-Videoattention blockOne-Shot TurningExperimentvideo-to-video

推荐整理分享【论文精读】Tune-A-Video: One-Shot Tuning of Image Diffusion Models for Text-to-Video Generation(论文精读分析报告),希望有所帮助,仅作参考,欢迎阅读内容。

文章相关热门搜索词:精读一篇论文要多久,论文精粹,论文精读报告怎么写,论文精读分享,精读论文题目,论文精读分享,论文精读分享,论文精读分享,内容如对您有帮助,希望把文章链接给更多的朋友!

修改文本内容,生成新的视频。

Abstract

由于T2I的成功,近日T2V的方法在大量的T2I的数据集中加入fine-turning.我们试图给出一个One-Shot Video Generation。 1、产生图像与动词对齐。 2、扩展文本到图像的模型,同时生产多张图片。 作者提出Turn a video的方法,高效的fine-turn翻译成2D的扩散模型,通过文本生成视频。改变元素、背景或者风格的转换。

Introduction

让模型具有One-Shot的能力。 原模型:缺乏连贯性,动作、背景不连贯。不符合对视频生成的要求。 新模型:增加了Self-Attention(由空间相似性驱动,而不是像素的位置),增加了连贯性,主体一致性

预训练文本-视频,由3×3扩展到1×3×3 具有结构相似性。

寄存量呈平方式增加(过大), 提出Sparse-Causal Attention(SC-Attn) 对于因果Attentiion的变形,稀疏版本。 该方法可以回归生成任意长度的视频帧。 Sparse-Causal是Causal的稀疏版

上:膨胀成文本到视频 下:新的文本,生成对应视频(动作不变) pipeline diffusion U-NET模型,下方attention模型,修改为Sparse-Causal Attention。

【论文精读】Tune-A-Video: One-Shot Tuning of Image Diffusion Models for Text-to-Video Generation(论文精读分析报告)

concat

投影到矩阵。

MethodDiffusion ModelsLatent Diffusion ModelOne-shot Video Generation

生成相同语义信息。 无法生成连续的动作

动作词语需要一致

Our Tune-A-Video

“膨胀” 2D的convolution

3×3 1×3×3(frame层转移到batch,依然是2D)

attention block

①a spatial self-attention ②a cross attention

One-Shot Turning

KEY和VALUE由前一帧推断出

应用场景:元素修改,背景替换,风格迁移

Experiment

消融实验

本文链接地址:https://www.jiuchutong.com/zhishi/299937.html 转载请保留说明!

上一篇:数据挖掘(4.1)--分类和预测(数据挖掘的四种基本方法)

下一篇:react——路由(react中路由有哪些常用组件)

  • 计提本月增值税会计科目
  • 水电怎么开票
  • 财务费用包含哪些项目
  • 分公司开专票需要缴税
  • 印花税减免退税会计分录
  • 出售自用汽车的税率
  • 城建税 申报表
  • 去税务局申报需要带营业执照吗
  • 所得税多交怎么调整
  • 小规模纳税人支付的增值税
  • 股东个人向公司借款会计分录
  • 外商投资企业提取储备基金
  • 工会经费拨缴是什么意思
  • 年末结转流程图
  • 境外公司付款给国内公司人民币
  • 工程预付款需要监理审批吗
  • 营增改后,建筑施工企业有哪些改变?
  • 上年度的费用今年开票分录
  • 应付账款对账的流程和技巧
  • 以销定产 以产定销
  • 服务费主营业务收入会计分录
  • 文化事业税收优惠政策
  • 企业报税的详细流程期限为
  • 免税销售额需要价税分离吗
  • 社保退回的钱怎么做会计分录
  • win10锁屏界面windows聚焦什么意思
  • 最终控制方合并报表账面价值
  • 个税的征税范围主要包括哪些项目
  • uniapp关闭当前页面
  • 软件服务费怎么算
  • .exe是指什么文件
  • php正则表达式匹配链接
  • phpsession和cookie
  • PHP面向对象程序设计
  • 【AIGC】6、Segment Anything | Meta 推出超强悍可分割一切的模型 SAM
  • 立体匹配原理
  • python安装后找不到了
  • 金融资产减值迹象
  • phpcms教程
  • 租赁增值税发票税率
  • 个人所得税app怎么查询个人所得税
  • sqlsever修改数据
  • 初始化mysql命令
  • 物业公司一般纳税人简易征收
  • 管理费用 暂估入账
  • 债务重组账务记忆口诀
  • 应交增值税减免税额在借方
  • 门面转让费怎么开发票
  • 提取银行存款利息分录
  • 建筑材料租赁公司
  • 税率调整后税差怎么算
  • 研发费用凭证附件
  • 利润表中管理费用根据什么填
  • 车船税开在备注栏相关文件
  • 工程费用科目
  • 分公司从业人数填越少越好吗
  • Mysql使用教程
  • MySQL存储过程与触发器
  • mysql参数表
  • 服务器文件夹共享分组
  • windows 10预览版
  • windows server 2008 r2有哪些特点
  • linux深入理解
  • windows没网络是怎么回事
  • linux搭建l2tp服务器
  • 彻底禁止win11自动更新
  • Win10中文输入法不能用
  • linux系统怎么更改语言
  • win7更新显卡驱动后黑屏的解决方法
  • andriod 控件
  • java语言的解释器是什么
  • 批处理命令是什么语言
  • pval 胶水
  • cocos creator2.4
  • jquery网页制作
  • 1、Android Studio创建android项目
  • 用javascript
  • javascript整数类型
  • 电子税务局个体工商户如何登陆
  • 差额开票扣除额多补税
  • 免责声明:网站部分图片文字素材来源于网络,如有侵权,请及时告知,我们会第一时间删除,谢谢! 邮箱:opceo@qq.com

    鄂ICP备2023003026号

    网站地图: 企业信息 工商信息 财税知识 网络常识 编程技术

    友情链接: 武汉网站建设