当前位置: 首页 > news >正文

网站建设的技术准备郑州市建筑工程信息网

网站建设的技术准备,郑州市建筑工程信息网,展示型网站设计与制作团队,新发布的新闻BLIP2的任务是基于已有的固定参数的图像encoder和语言大模型#xff08;LLM#xff09;搭建一个具有图像理解能力的图文模型#xff0c;输入是图像和文本#xff0c;输出是文本。 BLIP2基于Q-Former结构#xff0c;如下图所示。Q-Former包含图像transformer和文本transfo…BLIP2的任务是基于已有的固定参数的图像encoder和语言大模型LLM搭建一个具有图像理解能力的图文模型输入是图像和文本输出是文本。 BLIP2基于Q-Former结构如下图所示。Q-Former包含图像transformer和文本transformer两个transformer。两个transformer的self-attention layer是共享的。图像transformer的输入是固定数量的可学习的query embedding。query embedding先通过self-attention和文本交互再并通过cross-attention和图像特征交互。Q-Former的cross-attention的参数随机初始化其他参数用bert的参数初始化。Q-Former的优势是可以从图像encoder中提取出固定长度的特征。 BLIP2的训练分为两步 从固定参数的图像encoder学习视觉文本编码有Image-Text Contrastive Learning (ITC)、Image-grounded Text Generation (ITG) 、Image-Text Matching (ITM)三个训练目标。从固定参数的LLM学习理解图片生成文本。通过FC层连接Q-Former将queries的映射到和文本token相同维度拼接在文本前面。 图像encoder选择了CLIP的ViT-L/14和EVA-CLIP的ViT-G/14。LLM选择了OPT和FlanT5。 训练数据包含129M幅图片来自COCO、Visual Genome、CC3M、 CC12M、SBU、 LAION400M。互联网图片使用CapFilt方法生成文本描述。
http://www.hkea.cn/news/14562788/

相关文章:

  • 字体设计教程网站好如何制作课程网站
  • 一元云购网站建设模块高端菜单设计制作
  • 网站有什么好处一个正规的网站建设公司
  • 公共化网站建设方案北京建站报价
  • 常用网站设计缩略图seo关键词怎么优化
  • 网站开发技术案例班级优化大师使用心得
  • 756ka网站建设网站英文域名
  • 网站建设公司兴田德润电话我要找人做网站的主页
  • 网站排名突然掉没了东莞模板网站
  • 开放大学门户网站建设手机页面
  • 做3d动画的斑马网站施工企业会计王玉红课后答案
  • 哪个网站有免费的模板怎样微信公众号开发
  • 海兴做网站TP5企业网站开发教程百度云
  • 重庆网站建设夹夹虫wordpress支付宝免插件
  • 小店怎么做网站国外的做的比较优秀的网站有哪些
  • 深圳建设银行网站首页wordpress搬家全站 404
  • 常见的网站推广方法孟州网站建设
  • 郑州网站推广效果wordpress媒体库一直转圈
  • 俄语免费网站制作百度大数据分析平台
  • h5制作的炫酷个人网站模仿网站建设站建设
  • 十堰为企业做网站的单位电脑零基础培训学校
  • 做一个网站需要哪些资源太原谁家网站做的好
  • 静态网页模板免费下载的网站河南省网站建设哪家好
  • 乐陵市住房和城乡建设局网站天津和平做网站公司
  • php 开源企业网站平面设计和网页设计哪个好
  • 网站服务器租赁费用表格现在外贸推广做哪个平台
  • 品牌展示榜ui做的好的网站wordpress权限控制
  • app定制化开发网站优化标签
  • 昨天正常的网站突然显示建设中东莞做网站需要避免这些因素
  • 江西恒通建设工程有限公司网站做样子的网站