位置: IT常识 - 正文

【论文精读】Tune-A-Video: One-Shot Tuning of Image Diffusion Models for Text-to-Video Generation(论文精读分析报告)

编辑:rootadmin
【论文精读】Tune-A-Video: One-Shot Tuning of Image Diffusion Models for Text-to-Video Generation Tune-A-Video: One-Shot Tuning of Image Diffusion Models for Text-to-Video Generationvideo-to-videoAbstractIntroductionMethodDiffusion ModelsLatent Diffusion ModelOne-shot Video GenerationOur Tune-A-Videoattention blockOne-Shot TurningExperimentvideo-to-video

推荐整理分享【论文精读】Tune-A-Video: One-Shot Tuning of Image Diffusion Models for Text-to-Video Generation(论文精读分析报告),希望有所帮助,仅作参考,欢迎阅读内容。

文章相关热门搜索词:精读一篇论文要多久,论文精粹,论文精读报告怎么写,论文精读分享,精读论文题目,论文精读分享,论文精读分享,论文精读分享,内容如对您有帮助,希望把文章链接给更多的朋友!

修改文本内容,生成新的视频。

Abstract

由于T2I的成功,近日T2V的方法在大量的T2I的数据集中加入fine-turning.我们试图给出一个One-Shot Video Generation。 1、产生图像与动词对齐。 2、扩展文本到图像的模型,同时生产多张图片。 作者提出Turn a video的方法,高效的fine-turn翻译成2D的扩散模型,通过文本生成视频。改变元素、背景或者风格的转换。

Introduction

让模型具有One-Shot的能力。 原模型:缺乏连贯性,动作、背景不连贯。不符合对视频生成的要求。 新模型:增加了Self-Attention(由空间相似性驱动,而不是像素的位置),增加了连贯性,主体一致性

预训练文本-视频,由3×3扩展到1×3×3 具有结构相似性。

寄存量呈平方式增加(过大), 提出Sparse-Causal Attention(SC-Attn) 对于因果Attentiion的变形,稀疏版本。 该方法可以回归生成任意长度的视频帧。 Sparse-Causal是Causal的稀疏版

上:膨胀成文本到视频 下:新的文本,生成对应视频(动作不变) pipeline diffusion U-NET模型,下方attention模型,修改为Sparse-Causal Attention。

【论文精读】Tune-A-Video: One-Shot Tuning of Image Diffusion Models for Text-to-Video Generation(论文精读分析报告)

concat

投影到矩阵。

MethodDiffusion ModelsLatent Diffusion ModelOne-shot Video Generation

生成相同语义信息。 无法生成连续的动作

动作词语需要一致

Our Tune-A-Video

“膨胀” 2D的convolution

3×3 1×3×3(frame层转移到batch,依然是2D)

attention block

①a spatial self-attention ②a cross attention

One-Shot Turning

KEY和VALUE由前一帧推断出

应用场景:元素修改,背景替换,风格迁移

Experiment

消融实验

本文链接地址:https://www.jiuchutong.com/zhishi/299937.html 转载请保留说明!

上一篇:数据挖掘(4.1)--分类和预测(数据挖掘的四种基本方法)

下一篇:react——路由(react中路由有哪些常用组件)

  • 进口报关商品的完税价格包含运费吗
  • 计算增值税时要包括关税吗
  • 税务局未核定的印花税
  • 香港保险代理人佣金
  • 小公司可以不交五险一金吗
  • 支付货款订金入什么科目核算与会计分录
  • 建筑业发票可以在备注里加备注么
  • 负债减少在什么方
  • 划拨土地能转为商业用地吗
  • 自然人增值税免税额
  • 土地使用证明可以补办吗
  • 车辆一次性入费用会计分录
  • 营改增后增值税专用发票抵扣规定
  • 租赁业务增值税纳税义务发生时间
  • 其他货币资金的概念
  • 如何申报固定资产投资
  • 应收账款的贷方反映
  • 公司投资私募股票有哪些
  • 会计做账中记账表怎么做
  • 集团内部企业之间借款利息增值税
  • Mac怎么强制关闭程序
  • 小规模防伪税控服务费280元
  • win7安装netframework4.5
  • 制造企业成本计算模型有哪些类型
  • 出口退税无纸化备案怎么弄
  • 会计分录怎么分借方和贷方
  • php简单获取网站的方法
  • MS Excel: COUNTIF Function (WS)
  • python 二值化
  • 补缴以前年度企业所得税如何做账
  • 临时工交押金会扣钱吗
  • 开具农产品收购发票需要什么资料
  • 简述社会保险的项目
  • 价税合计公式分配
  • 公转私法人
  • 如何拉企业纳税申报表
  • 应交增值税进项税额
  • SQLServer2005 Output子句获取刚插入的ID值
  • sql server job
  • SQL Server Management Studio教程
  • 公司财务报表中不设其他综合收益项目可以吗
  • 小规模纳税人申报纳税详细流程
  • 多记财务费用怎么调整
  • 车辆置换差价账务处理
  • 非公司人员差旅怎么报销
  • 个体工商户不缴纳印花税吗
  • 个体工商户要进行汇算清缴吗
  • 补交进项转出的税分录
  • 增值税专用发票几个点
  • 施工企业如何确定收入和成本
  • 政府投资资产会计核算科目
  • 在我国土地使用权分为哪几类
  • 所有者权益科目有哪些
  • 投入的资金如何做账
  • 员工出差的餐费可以抵扣吗
  • 天猫佣金会返还吗
  • 现金流量结构分析表
  • 旅行社财务会计工作内容
  • 工业企业应通过其他应付款科目核算的有
  • macbookpro mysql
  • 左右内边距代码
  • 苹果电脑安装win7系统教程
  • windows8开机慢怎么办
  • 备份ubuntu系统
  • kernel headers not found for target kernel
  • windows8怎么关闭广告弹窗
  • linux a
  • 作战仿真理论与技术
  • bootstrap 下拉框绑定数据
  • 个人简历
  • XMLHttpRequest Level 2 使用指南
  • jquery删除节点的元素
  • android升级是什么意思
  • javascript基础书
  • jquery动画让div旋转
  • android面试2021
  • java模拟支付功能
  • 消费税由消费者承担吗
  • 广西12366医保缴费
  • 应缴纳资源税税额怎么计算
  • 免责声明:网站部分图片文字素材来源于网络,如有侵权,请及时告知,我们会第一时间删除,谢谢! 邮箱:opceo@qq.com

    鄂ICP备2023003026号

    网站地图: 企业信息 工商信息 财税知识 网络常识 编程技术

    友情链接: 武汉网站建设