当前位置: 首页 > news >正文

h5互动网站建设北京网站建设平台

h5互动网站建设,北京网站建设平台,湖北营销型网站建设公司,app制作培训班引言 解码器Transformer的规模不断壮大#xff0c;轻松达到千亿级参数。同时由于该规模#xff0c;基于提示或微调在各种NLP任务上达到SOTA结果。但目前为止解码器Transformer还无法应用在语义搜索或语句嵌入上。 为了简单#xff0c;下文中以翻译的口吻记录#xff0c;比…引言 解码器Transformer的规模不断壮大轻松达到千亿级参数。同时由于该规模基于提示或微调在各种NLP任务上达到SOTA结果。但目前为止解码器Transformer还无法应用在语义搜索或语句嵌入上。 为了简单下文中以翻译的口吻记录比如替换作者为我们。 作者提出了SGPT方法来解决这一问题代码开源在 https://github.com/Muennighoff/sgpt 。 1. 总体介绍 现阶段主要依赖于类似BERT的仅编码器Transformer编码句嵌入以提供语义搜索。因为目前尚未清楚如何从解码器中提取语义嵌入。但这种做法的好处是明显的 性能 解码器的参数量巨大这有可能产生SOTA结果节省计算 只需要维护解码器架构只训练一个大规模解码器并将其重用于搜索可以节省成本 图1 给定一个查询 q q q文档 d 1 − 3 d_{1-3} d1−3​SGPT通过分数 s 1 − 3 s_{1-3} s1−3​对文档进行排序。(a)Cross-Encoder拼接查询和文档然后一起编码。分数是对数概率。(b)Bi-Encoder分别对查询和文档进行编码生成的文档向量 v 1 − 3 v_{1-3} v1−3​可以缓存起来然后可以在新查询进来的时刻 t c t_c tc​被访问。分数是预先相似度。 在本篇工作中我们提出SGPT将仅解码器应用于语义搜索并提取有语义的句子嵌入。区分四种设置Cross-Encoder、Bi-Encoder、对称以及非对称。 2. 相关工作 Cross-Encoder同时对查询和文档进行编码。 Bi-Encoder分别对查询和文档进行编码。有研究者提出了一个基于GPT的Bi-Encoder cpt-text。 Cross-Encoder往往优于Bi-Encoder但速度较慢。 非对称搜索意味着查询和文档不可互换。 对称搜索意味着查询和文档可以互换。 3. SGPT Cross-Encoder 3.1 非对称搜索 给定查询 q q q和文档语料库 D D D对最有可能的文档 d ∗ d^* d∗感兴趣使用贝叶斯理论可以表示为 d ∗ arg ⁡ max ⁡ d ∈ D P ( d ∣ q ) arg ⁡ max ⁡ d ∈ D P ( q ∣ d ) P ( d ) P ( q ) arg ⁡ max ⁡ d ∈ D P ( q ∣ d ) P ( d ) (1) d^* \arg \max_{d \in D}P(d|q) \arg \max_{d\in D} \frac{P(q|d)P(d)}{P(q)} \arg \max _{d \in D} P(q|d)P(d) \tag 1 d∗argd∈Dmax​P(d∣q)argd∈Dmax​P(q)P(q∣d)P(d)​argd∈Dmax​P(q∣d)P(d)(1) 由于文档的长度是可变的且计算 P ( q ∣ d ) P(q|d) P(q∣d)比 P ( d ∣ q ) P(d|q) P(d∣q)容易因此我们给定嵌入提示 P P P的文档标记计算查询标记 q i , ⋯ , n q_{i,\cdots,n} qi,⋯,n​的联合概率为 p ( q i , ⋯ , q n ∣ p 1 , ⋯ , p i − 1 ) p(q_{i},\cdots,q_n|p_1,\cdots,p_{i-1}) p(qi​,⋯,qn​∣p1​,⋯,pi−1​)。因为 P ( d ) P(d) P(d)通常在语料库 D D D中不会变化而忽略 P ( d ) P(d) P(d)。 在实践中使用对数概率——模型输出的softmax的对数。 3.2 对称搜索 表3 Quora上的SGPE-CE(Cross-Encoder)对称搜索结果。来自{query}的对数概率之和作为重排名分数。从{doc}左侧截断过长的标记。重排名前100的文档分数为nDCG10。 使用§3.1中相同的方法但调整对称搜索的提示。如表3所示。 4. SGPT Bi-Encoder 4.1 对称搜索 由于自回归解码器Transformer的因果注意掩码即每个位置的token只能感知到其之前的信息。因此只有最后一个token关注了序列中的所有标记。SGPT提出使用位置加权池化方法为后面的标记赋予更高的权重 v ∑ i 1 S w i h i where w i i ∑ i 1 S i (2) v \sum_{i1}^S w_ih_i \quad \text{where} \quad w_i \frac{i}{\sum_{i1}^S i} \tag 2 vi1∑S​wi​hi​wherewi​∑i1S​ii​(2) S S S是序列长度 h i h_i hi​是第 i i i个隐藏状态 v v v是查询或文档嵌入。 我们将加权均值池化与最后一个标记池化进行比较其中最后一个标记的隐藏状态是嵌入或常规的均值池化。 使用批内负样本进行监督对比学习给定查询-文档对 { q ( i ) , d ( i ) } i 1 M \{q^{(i)},d^{(i)}\}_{i1}^M {q(i),d(i)}i1M​优化损失函数 J CL ( θ ) 1 M ∑ i 1 M log ⁡ exp ⁡ ( τ ⋅ σ ( f θ ( q ( i ) ) , f θ ( d ( i ) ) ) ) ∑ j 1 M exp ⁡ ( τ ⋅ σ ( f θ ( q ( i ) ) , f θ ( d ( j ) ) ) ) (3) J_\text{CL}(\theta) \frac{1}{M} \sum_{i1}^M \log \frac{\exp(\tau \cdot \sigma(f_\theta(q^{(i)}), f_\theta(d^{(i)})))}{\sum_{j1}^M \exp(\tau \cdot \sigma(f_\theta(q^{(i)}), f_\theta(d^{(j)})))} \tag 3 JCL​(θ)M1​i1∑M​log∑j1M​exp(τ⋅σ(fθ​(q(i)),fθ​(d(j))))exp(τ⋅σ(fθ​(q(i)),fθ​(d(i))))​(3) f θ f_\theta fθ​是SGPT模型输出固定大小的向量 σ \sigma σ是余弦相似度 τ \tau τ是一个温度参数设为 20 20 20相当于除以 0.05 0.05 0.05。在训练和推理期间将序列长度限制为75个标记。 4.2 非对称搜索 遵守§4.1中同样的设置。对于非对称搜索将模型序列长度限制为300个标记。增加括号使模型区分查询和文档将查询 q q q的标记增加两个中括号作为 [ q 0 − n ] [q_{0-n}] [q0−n​]文档使花括号 { d 0 − n } \{d_{0-n}\} {d0−n​}。 5. 结论 这篇工作介绍了SGPT提出对GPT模型进行修改将它们用于语义搜索的Cross-或Bi-编码器。 SGPT-BE使用位置加权均值得到最先进的句子嵌入可以用于语义搜索或其他嵌任务。 SGPT-CE提取预训练GPT模型的对数概率产生无监督的最先进的搜索结果但只能用于语义搜索。 B任务和实验细节 B.1 提示 总结 ⭐ 作者提出了利用仅编码器的类GPT架构来产生句子嵌入以支持语义检索和其他嵌入任务。在Bi-Encoder设置中使用位置加权平均池化来得到具有语义信息的句子嵌入。在Cross-Encoder设置中提取预训练GPT模型的对数概率产生无监督结果。
http://www.hkea.cn/news/14360551/

相关文章:

  • 湛江专业建站公司搅拌机东莞网站建设技术支持
  • 小区的名字建设单位去什么网站备案上传了源程序提示网站建设中
  • 合肥快速做网站客户评论 网站建设
  • 自动跳转手机网站代码什么是网页设计规范
  • 自适应产品网站模板绍兴做外贸网站的公司
  • 建设网站代码网站排名在线优化工具
  • aspnet网站开发模板电商网站模板
  • 做网站推广需要什么专业用织梦做的学校网站
  • ppt模板网站哪个免费沈阳养老保险网站
  • wordpress 建站模板公司网站建设与管理的作用
  • 个人购买域名做企业网站wordpress 列表 展开收缩
  • 网站营销工作流程建设机械网站资讯
  • 昆明网站建设高端定制番禺建设网站公司
  • 建网页还是网站好电商平面设计工资一般多少
  • 个人备案 网站名称 例子微网站制作价格
  • 手机网站建设的教程视频足球网站开发
  • 广告网站模板广州越秀区发布紧急通告
  • 建设银行网站查询房贷信息查询德州北京网站建设
  • 手机建设网站wordpress 标签 文章
  • 做网站建设的有哪些网络科技官网网站建设
  • h5响应式网站上海荷城网站制作公司
  • 上海公司网站设计超酷 flash 网站
  • 百度收录收费 重大网站免费挣钱最快的游戏
  • 电脑上怎么建设网站提供网站备案信息
  • 网站开发税费ic外贸网站建设
  • 建设网站前端asp.net制作的网站开发
  • 手机网站宽度自适应网站seo哪里做的好
  • 网站建设的维护范围网页工具栏怎么还原
  • 张雪峰建议取消市场营销宁波网站快速优化
  • 个人免费网站平台网站空间怎么续费