位置: IT常识 - 正文

【论文精读】Tune-A-Video: One-Shot Tuning of Image Diffusion Models for Text-to-Video Generation(论文精读分析报告)

编辑:rootadmin
【论文精读】Tune-A-Video: One-Shot Tuning of Image Diffusion Models for Text-to-Video Generation Tune-A-Video: One-Shot Tuning of Image Diffusion Models for Text-to-Video Generationvideo-to-videoAbstractIntroductionMethodDiffusion ModelsLatent Diffusion ModelOne-shot Video GenerationOur Tune-A-Videoattention blockOne-Shot TurningExperimentvideo-to-video

推荐整理分享【论文精读】Tune-A-Video: One-Shot Tuning of Image Diffusion Models for Text-to-Video Generation(论文精读分析报告),希望有所帮助,仅作参考,欢迎阅读内容。

文章相关热门搜索词:精读一篇论文要多久,论文精粹,论文精读报告怎么写,论文精读分享,精读论文题目,论文精读分享,论文精读分享,论文精读分享,内容如对您有帮助,希望把文章链接给更多的朋友!

修改文本内容,生成新的视频。

Abstract

由于T2I的成功,近日T2V的方法在大量的T2I的数据集中加入fine-turning.我们试图给出一个One-Shot Video Generation。 1、产生图像与动词对齐。 2、扩展文本到图像的模型,同时生产多张图片。 作者提出Turn a video的方法,高效的fine-turn翻译成2D的扩散模型,通过文本生成视频。改变元素、背景或者风格的转换。

Introduction

让模型具有One-Shot的能力。 原模型:缺乏连贯性,动作、背景不连贯。不符合对视频生成的要求。 新模型:增加了Self-Attention(由空间相似性驱动,而不是像素的位置),增加了连贯性,主体一致性

预训练文本-视频,由3×3扩展到1×3×3 具有结构相似性。

寄存量呈平方式增加(过大), 提出Sparse-Causal Attention(SC-Attn) 对于因果Attentiion的变形,稀疏版本。 该方法可以回归生成任意长度的视频帧。 Sparse-Causal是Causal的稀疏版

上:膨胀成文本到视频 下:新的文本,生成对应视频(动作不变) pipeline diffusion U-NET模型,下方attention模型,修改为Sparse-Causal Attention。

【论文精读】Tune-A-Video: One-Shot Tuning of Image Diffusion Models for Text-to-Video Generation(论文精读分析报告)

concat

投影到矩阵。

MethodDiffusion ModelsLatent Diffusion ModelOne-shot Video Generation

生成相同语义信息。 无法生成连续的动作

动作词语需要一致

Our Tune-A-Video

“膨胀” 2D的convolution

3×3 1×3×3(frame层转移到batch,依然是2D)

attention block

①a spatial self-attention ②a cross attention

One-Shot Turning

KEY和VALUE由前一帧推断出

应用场景:元素修改,背景替换,风格迁移

Experiment

消融实验

本文链接地址:https://www.jiuchutong.com/zhishi/299937.html 转载请保留说明!

上一篇:数据挖掘(4.1)--分类和预测(数据挖掘的四种基本方法)

下一篇:react——路由(react中路由有哪些常用组件)

  • 个体户定期定额征收标准
  • 银行手续费回单可以作为入账依据吗
  • 财务软件费用可以抵税吗
  • 非货币资产交换和债务重组的区别
  • 债券的利益
  • 上个月没有清卡,这个月可以抄税吗
  • 税务局的信用等级是多少
  • 转让不动产取得的收入
  • 资产收购应如何计算
  • 可以采用三栏式的明细账的有
  • 减免应收账款账务处理
  • 发票收到以后必须查验吗
  • 为什么企业要预缴增值税
  • 公户转账给个人没有票
  • 产品售后维修费分录
  • 企业三废处理方案
  • etc充值发票可以抵扣税吗
  • 如何判断发票是否重复
  • 支票大写金额书写转换
  • 所有者权益合计是负数是什么意思
  • 法人向公司借款用途怎么写
  • 单位卖报纸的钱算什么
  • 财务人员工资计入什么费用?
  • 其他权益工具投资公允价值变动怎么计算
  • 研发费用计入什么科目符合资本化
  • 所得税费用是什么账户类型
  • 实收资本是认缴出资吗
  • 支付借款利息怎么做账
  • php获取多选框的值
  • PHP:stream_encoding()的用法_Stream函数
  • 汇票本票支票的相同点和不同点
  • 销售自己使用过的旧货
  • 优先股转化
  • 豁免债权如何做账
  • 发票抬头可以是两个人吗
  • 商业汇票抵付前欠货款的分录
  • 用抵扣券买了东西可以退吗
  • redis php实例
  • springboot用法
  • 增值税留抵税额计入什么科目
  • 开具增值税专用发票的规定
  • SQL Server 在Management Studio中使用Web浏览器
  • 法人股东 分红
  • 预算收入分为哪几种方式
  • 普票要盖发票的章子吗
  • mysql 管理员登录
  • 待转销项税额转出
  • 退回工伤保险的现金流
  • 增值税普通发票和电子普通发票的区别
  • 在建工程前期投标流程
  • 外贸公司收取客户的费用
  • 已退货对方不开红字
  • 前程无忧是怎么收费的
  • 机票行程单上没有金额怎么报销
  • 会计中原始凭证是什么意思
  • 私企会计一般一个月多少钱
  • 总结下半年工作计划
  • 在SQL Server中使用存储过程的优点包括
  • 数据库中自动增长
  • asp.net select
  • centos 6.5下 mysql-community-server. 5.7.18-1.el6安装
  • win8系统打不开
  • Windows server 2003 密码忘了
  • ubuntu18.04更新到20.04
  • linux的telnet用法
  • 系统自动设置网络连接
  • 在服务器上创建用户
  • reg.exe是什么东西?
  • linux 文件夹权限 777
  • win10超级按钮
  • 用jquery
  • shell脚本转换为exe
  • html5字体闪烁
  • javascript怎么用
  • Node.js中的事件循环是什么
  • HttpURLConnection的流式输出的缺陷和解决方法
  • android 保存密码
  • 发布python程序
  • Python中使用装饰器来优化尾递归的示例
  • 土地增值税清算时间要求
  • 免责声明:网站部分图片文字素材来源于网络,如有侵权,请及时告知,我们会第一时间删除,谢谢! 邮箱:opceo@qq.com

    鄂ICP备2023003026号

    网站地图: 企业信息 工商信息 财税知识 网络常识 编程技术

    友情链接: 武汉网站建设