当前位置: 首页 > news >正文

网站页面设计的网址wordpress 文章概要

网站页面设计的网址,wordpress 文章概要,揭阳购物网站开发设计,贵阳网站开发推荐VideoBooth: Diffusion-based Video Generation with Image Prompts 概括 文章提出了一个视频生成模型VideoBooth#xff0c;输入一张图片和一个文本提示词#xff0c;即可输出保持图片中物体且符合文本提示词要求的视频。 方法 粗-细两阶段设计#xff1a;1#xff09;…VideoBooth: Diffusion-based Video Generation with Image Prompts 概括 文章提出了一个视频生成模型VideoBooth输入一张图片和一个文本提示词即可输出保持图片中物体且符合文本提示词要求的视频。 方法 粗-细两阶段设计1粗阶段利用CLIP图像编码器将图片视觉编码注入文本嵌入中融合后的嵌入送入cross attention层2细阶段将多尺度图片空间信息注入视频生成模型的cross-frame attentions层。 一些困惑 多尺度的图片编码是用什么图像编码器获取的通过VAE获取潜在表征而这个多尺度其实就是潜在编码在U-Net在不同阶段的输出。 预备知识 拓展2D卷积为了处理视频数据和时序关联我们将SD模型中的2D卷积扩展为了3D卷积。应该指的是U-Net中的卷积层交叉帧注意力模块SD模型中原本的自注意力模块被修改成了交叉帧注意力模块以提高时序一致性。交叉帧模块同时处理空间和时序域因此可以提高合成帧的时序一致性。时序注意力模块处理时序域对所有帧起作用提高时序一致性。 粗粒度视觉编码 使用CLIP获取图像提示词和文本提示词的编码信息然后将文本编码中目标物体的编码替换为图像视觉编码将融合后的视觉-图像编码送入交叉注意力层。CLIP图像编码器是固定的但是为了对齐图像和文本编码图像编码会经过MLP层。此外为了适配融合后的编码交叉注意力层中的K和V也被微调了。 细粒度视觉编码 这部分的编码信息应该是用来保证时序一致性的。首先通过VAE获取图像潜在编码然后加噪送入U-Net每个阶段的U-Net输出包括最初的潜在编码对应的K-V都会和原始的K-V进行拼接初始帧的V被更新并影响后续所有的Value。 实验
http://www.hkea.cn/news/14528303/

相关文章:

  • 什么自己做网站行者seo无敌
  • 是用cms还是直接用语言写网站湖南网络推广服务平台
  • 做网站视频一般上传到哪里网站建设资金管理办法
  • 旅游网站如何建设做网站好平台化
  • 云建站微网站网站设计与网站建设a卷
  • 上饶网站开发 app开发wordpress不用服务器
  • 快餐网站模板wordpress 后台界面
  • 网站如何在百度刷排名贵港住房城乡建设厅网站
  • 济南网站建设网络公司电子商务网站建设课程设计总结
  • 网站开发承诺函我想做地推怎么找渠道
  • 做网站论文品牌网站建设工作室
  • 东莞网站建设推广方案wordpress 4.5 主题
  • 义乌设计网站2014年网站开发语言
  • 制作网站的步骤是什么html代码在线
  • 如何修改用织梦做的网站的模板招标网站免费平台
  • 商城网站建设服务哪家好我要自学网网站建设
  • 免费建一个自己的网站有人找做网站的
  • 网站建设活动方案最新企业网站
  • 陕西 网站建设网站建设的技术难点
  • 深圳建设营销型网站网站服务器租赁
  • 沈阳做网站制作的公司网站建设运营有限公司
  • 塑胶制品塘厦东莞网站建设长沙seo网站优化公司
  • 学校网站框架html手机网站如何制作
  • 网站后台密码忘了湖南网站建设哪家好
  • 网络营销推广网站企业网站建设管理平台
  • 河南做外贸网站的公司简介网站建设专家有哪些
  • 餐饮网站建设方案书旅游手机网站建设智慧旅游
  • 网页版传奇游戏怎么制作wordpress h1标签优化
  • 网站后台风格网络服务器性能
  • 月付网站空间提供商微信公众号开发软件