当前位置: 首页 > news >正文

wordpress站群功能网站流量提供商

wordpress站群功能,网站流量提供商,在电脑上怎么做网站,企业中英文网站建设基于已有的图像模型和文本模型构建多模态模型。输入是图像、视频和文本#xff0c;输出是文本。 Vision encoder来自预训练的NormalizerFree ResNet (NFNet)#xff0c;之后经过图文对比损失学习。图片经过图像模型的输出是2D grid#xff0c;视频按1FPS的频率采样后经过图…基于已有的图像模型和文本模型构建多模态模型。输入是图像、视频和文本输出是文本。 Vision encoder来自预训练的NormalizerFree ResNet (NFNet)之后经过图文对比损失学习。图片经过图像模型的输出是2D grid视频按1FPS的频率采样后经过图像模型的输出是3D grid都展开成1D送入Perceiver Resampler。 Perceiver Resampler将变长的图片或者视频的特征变成固定长度。结构如下图 通过gated cross-attention dense模块结合图像特征和文本特征。gated cross-attention dense模块使用了tanh-gating机制用tanh(a)乘以文本和图像模态cross-attention后的输出a初始化为0。tanh-gating机制保证初始化的时候模型不受图像特征的影响输出就是语言模型的输出。 使用single-image cross-attention方法在计算图像和文本的cross-attention时通过mask让文本token只能看到前面的一幅图像的token。 训练数据数据集包括公开数据和自建数据。M3W43 million webpages、ALIGN dataset1.8 billion images with alt-text 43 million webpages、312 million image and text pairs、27 million short videos and text pairs。
http://www.hkea.cn/news/14374752/

相关文章:

  • 企业电子网站的建设案例详细描述建设一个网站的具体步骤
  • 电子商务网站建设毕业设计提高网站流量原则
  • 网站如何推广方式一个销售网站的设计 应当是要
  • 大连建设网站制作家具网站设计网站
  • 建站系统wordpress下载网站建设平台是干什么的
  • 门户网站系统开发wordpress营业按钮
  • 网站后台发布图片upload failed网站建设流程精英
  • 怎么去做网站上线后wordpress后台无法登陆
  • 邢台网站1237一12岁手工暗器
  • 网站建设ppt简介兰州起点网站建设
  • 电子外贸网站建设猫咪网站模版下载
  • 最便宜的购物网站排名徐州网站开发案例
  • 六安网站建设推荐宣传推广方案范文
  • 郑州网站优化工资南靖网站建设
  • 南昌企业网站建设网店运营教学
  • 青岛网站建设代理加盟免费网站建设系统
  • 基于liferay portal的乡镇企业门户网站建设研究网站系统灵活性
  • 网站建设方案页面设计分析网络销售新手入门
  • 阅读网站模板下载摄影集 wordpress
  • 企业网站源码怎么获取企业建网站平台
  • 个人怎么注册网站流程有了网站源码怎么做网站
  • 深圳网站建设全包社区网站的建设
  • 厦门建设局网站商品房建设网站应该加什么服务器
  • 怎样能让百度搜到自己的网站网站点击赚钱怎么做
  • 网站建设青雀品牌策划与推广方案
  • wordpress 整站ssl在线制作图片的免费软件
  • 网站建设课题简介网站建设教育平台
  • 域名打不开原来的网站概述网站建设的流程
  • 谷歌绘制的网站wordpress主题 电影
  • 网站加速器免费永久如何提高网站的收录率和收录量