当前位置: 首页 > news >正文

广告网站模板下载不了怎么做网站的ico

广告网站模板下载不了,怎么做网站的ico,网站建设白云,手机怎么自己制作网页当前的问题 CLIP-Adapter仅单独调整图像和文本嵌入#xff0c;忽略了不同模态之间的交互作用。此外#xff0c;适应性参数容易过拟合训练数据#xff0c;导致新任务泛化能力的损失。 动机 图1所示。多模态适配器说明。 通过一种基于注意力的 Adapter #xff0c;作者称之…当前的问题 CLIP-Adapter仅单独调整图像和文本嵌入忽略了不同模态之间的交互作用。此外适应性参数容易过拟合训练数据导致新任务泛化能力的损失。 动机 图1所示。多模态适配器说明。 通过一种基于注意力的 Adapter 作者称之为多模态 Adapter 图1通过整合它们的信息共同调整文本和图像特征导致更全面的适配。此外适配是针对特定任务的有效地利用每个任务的视觉和文本信息。这使得模型能够更有效地避免在训练任务上过拟合从而在未见过的任务上获得更好的泛化能力。 方法 多模态 Adapter 包括三个不同的部分一个嵌入降采样器、一个 Mask 多头注意力网络以及两个带有非线性激活函数的线性层。 维度下采样 在 Adapter 中使用了多头注意力层来聚合多模态信息。然而多头注意力层可能会给网络引入参数昂贵的操作尤其是当嵌入维度较大时例如原始CLIP的嵌入维度 ( C Emb ) 512 (\text{C}_{\text{Emb}})512 (CEmb​)512。为了降低可训练参数的数量作者在注意力层之前在CLIP嵌入上引入了一个维度下采样器。下采样器由一个线性层 D ( ⋅ ) D(\cdot) D(⋅)组成该层降低嵌入维度。最后多头注意力层的输入通过 D ( ⋅ ) D(\cdot) D(⋅)传递其中 W D ∈ R C Emb × C Emb / 4 W_D\in \mathbb{R}^{\text{C}_{\text{Emb}}\times \text{C}_{\text{Emb}}/4} WD​∈RCEmb​×CEmb​/4 。 每个图像样本创建多头注意 ( MHA ( ⋅ ) ) (\text{MHA}(\cdot)) (MHA(⋅))输入。提示符 Emb text \text{Emb}_{\text{text}} Embtext​的文本嵌入和视觉输入 Emb image \text{Emb}_{\text{image}} Embimage​的图像嵌入被连接成一个序列 其中 Input MHA ∈ R ( N c l a s s e s 1 ) × N B a t c h × E N \text{Input}_{\text{MHA}}\in \mathbb{R}^{(N^{classes}1)\times N^{Batch}\times E_N} InputMHA​∈R(Nclasses1)×NBatch×EN​。其中 N c l a s s e s 1 N^{classes}1 Nclasses1表示类文本嵌入和一个图像嵌入的数量之和图2 E N E_N EN​表示嵌入的维数。 图2所示。 Input MHA \text{Input}_{\text{MHA}} InputMHA​的插图。文本表示与视觉表示串联成一个序列通过掩模多头注意网络传递。 Mask 多头注意力 在维度下采样后通过多头注意力层聚合潜在表示。为了区分多头注意力层的文本和图像输入使用注意力 Mask 来调整每个模态内的信息交互。**使用“0”表示正向交互“-∞”表示负向交互。**因此**每个文本嵌入仅由相应的图像信息调整而部分忽略其他文本嵌入中的信息。图像嵌入也是如此。**给定 P P P个 Prompt 和 I I I个图像 T P I TPI TPI总元素数。 、 me图示如下 其中 i i i表示行取值范围为 0 ∼ T − 1 0\sim T-1 0∼T−1 j j j表示列取值范围为 0 ∼ T − 1 0\sim T-1 0∼T−1。 掩码计算完成后通过求和运算将掩码应用到多头注意力网络中 多模态 Adapter 随后MHA的输出经过两个线性上采样层 U 1 ( ⋅ ) , U 2 ( ⋅ ) U_1(\cdot),U_2(\cdot) U1​(⋅),U2​(⋅)其间使用GELU其中 W U 1 ∈ R C Emb / 4 × C Emb / 16 , W U 2 ∈ R C Emb / 16 × C Emb W_{U1}\in \mathbb{R}^{\text{C}_{\text{Emb}/4}\times \text{C}_{\text{Emb}}/16},W_{U2}\in \mathbb{R}^{\text{C}_{\text{Emb}}/16 \times \text{C}_{\text{Emb}}} WU1​∈RCEmb/4​×CEmb​/16,WU2​∈RCEmb​/16×CEmb​ 总之我们完成了多模态适配器 实验结果 参考资料 论文下载(arxiv,3 Sep 2024) https://www.arxiv.org/abs/2409.02958 代码地址 https://github.com/dqmis/clip-mma 参考文章 https://mp.weixin.qq.com/s/VP4R9-ZYSohwxdY9W3xJQg
http://www.hkea.cn/news/14308901/

相关文章:

  • 计算机网络 网站开发与设计广告交流群
  • 莱州做网站福田祥菱怎么样
  • 合肥网站制作公司排名网络营销工具优缺点
  • 静态网站开发语言wordpress屏蔽索引
  • 不良网站浏览窗口福步外贸论坛怎么发帖
  • 网站做零售最新网站排名优化方法
  • 简单免费自建网站全渠道营销的概念
  • 外贸自建站如何收款国内免费可商用图片素材网站
  • 哪个网站做logo网站个人备案需要什么资料
  • 车辆年检查询系统官方网站最基本的网络营销站点
  • 北京平台网站建设公司互联网官网入口
  • 网站的内部链接如何做网站建设直通车关键词设置
  • 广西网站建设产品介绍软件开发主要是干什么的
  • 企业网站开发需要蓝色 网站
  • 做照片的网站网站建设_聊城
  • 云建站app免费推广网站平台
  • 网站会员功能新万网站建设
  • 怎么在网站添加paypal贵阳大数据论坛
  • 河北港网站建设网站建设推广服务合同范本
  • 网站变灰是什么事网站怎样被百度收录
  • 毕节网站网站建设军事天地最新消息
  • 快三竞猜网站建设下载网站cms
  • 企业的外币收入外管局网站做啥视频号直播推广二维码
  • 天津手机网站建设制作申请自媒体账号入口
  • 介绍自己做的电影网站wordpress上传Flickr
  • 权威的广州h5网站网站建设策划书附录
  • 抚州网站推广人社局网站建设步骤
  • 网站建设泽宇深圳高端电商网站建设者
  • 海南住房与城乡建设网站惠州市网站建设
  • wordpress 游戏网站网站免费注册