当前位置: 首页 > news >正文

包头做网站的公司招聘信息天津百度seo推广

包头做网站的公司招聘信息,天津百度seo推广,海口公司做网站,wordpress插件过多不好先说结论#xff0c;大语言模型除了作为聊天的Agent#xff0c;也可以为检索模型生成优质的文本对训练数据#xff0c;从而做到无监督场景下也能够适用。这里分享一篇AAAI2024的工作#xff0c;重点探讨如何生成比评估集更困难的训练数据来提升无监督句子表示学习质量…先说结论大语言模型除了作为聊天的Agent也可以为检索模型生成优质的文本对训练数据从而做到无监督场景下也能够适用。这里分享一篇AAAI2024的工作重点探讨如何生成比评估集更困难的训练数据来提升无监督句子表示学习质量应该对很多表示学习工作都有一定启发 论文题目Narrowing the Gap between Supervised and Unsupervised Sentence Representation Learning with Large Language Model 来源AAAI2024/实验室师兄/北航 方向文本表示学习 开源地址https://github.com/BDBC-KG-NLP/NGCSE 摘要 句子表示学习SRL是自然语言处理NLP中的一项基本任务句子编码对比学习CSE因其优越的性能而成为主流技术。CSE中一个有趣的现象是有监督方法和无监督方法之间的显著性能差异它们唯一的区别在于训练数据。以前的工作将这种性能差距归因于对齐和均匀性的差异。然而由于对齐和均匀性只衡量结果他们没有回答“训练数据的什么方面导致了性能差距”以及“如何才能缩小性能差距”。 本文进行了实验来回答这两个问题。首先通过彻底比较监督和无监督CSE在各自训练过程中的行为来回答“什么”的问题。从比较中我们确定了相似度模式是性能差距的关键因素并引入了一个度量称为相对拟合难度Relative Fitting DifficultyRFD来衡量相似度模式的复杂性。 然后基于从“什么”问题中获得的见解我们通过增加训练数据的模式复杂性来解决“如何”问题。我们通过利用大语言模型LLM的上下文学习ICL能力来生成模拟复杂模式的数据来实现这一点。通过利用LLM生成数据中的有层次的模式本文有效地缩小了有监督和无监督CSE之间的差距。 介绍 “什么”导致了性能差距 相似度模式一个数据集怎样定义相似和不相似的文本对。训练数据集的相似度模式越复杂训练效果越好。训练集的相似度模式可以用训练集与评估集间的对齐和均匀性的相对大小来衡量。用这种方式可以发现有监督训练集NLI中的相似度模式要比评估集更复杂而无监督训练集Wiki中的相似度模式要比评估集简单。下图说明了这一结论在对齐和均匀性两个指标上有监督训练集都要高于评估集而无监督训练集都要更低。 由此本文提出了相对匹配难度Relative Fitting Difficulty (RFD)来评估相似度模式的复杂性即计算对比学习训练过程中Bert每个时间步在训练集和评估集的表征的对齐和均匀性的差值再取平均 实验表明RFD较大的数据确实能获得更好的效果下图中右上角的五角星代表本文的训练方法的结果可以看到相比左下方的之前的无监督训练方式都有明显提升同时RFD也基本都更大 如何才能缩小性能差距 接着本文通过LLM的上下文学习提示LLM模拟了NLI数据即两个句子是违背还是不违背和STSSTS数据将两个句子的相似度分为positiveintermediatenegative其中中间等级是让语言模型生成比positive细节少一些的句子 为了有效利用STS生成数据中的层次化结构关系本文还提出了一种层次化结构的三元损失Hierarchical Triplet (HT) loss 并将这个损失和对比损失结合作为训练目标 STS实验结果表明确实缩小了有监督和无监督训练的差异在STS16上完成了反超不过大部分还是不能达到有监督的水平 分类任务上将差距缩小到一个点以内部分结果基本相当 大家好我是NLP研究者BrownSearch如果你觉得本文对你有帮助的话不妨点赞或收藏支持我的创作您的正反馈是我持续更新的动力如果想了解更多LLM/检索的知识记得关注我
http://www.hkea.cn/news/14566919/

相关文章:

  • 可以做引流网站的源码远程服务器安装wordpress
  • 安徽城乡住房建设厅网站重庆网站seo多少钱
  • wordpress怎么重新初始化百度seo和sem的区别
  • 网站构架图怎么做云龙徐州网站开发
  • 做网站交互效果用什么软件大学生网页设计心得体会
  • 网站开发之美北京国税局网站官网入口
  • asp.net网站发布到虚拟主机郴州新网二手房出售
  • 环保科技东莞网站建设企业网站的建设与实现论文
  • 虚拟主机销售网站鹤壁市网站建设
  • 网站流量指标有哪些做设计需要知道的几个网站
  • 企业内部网站模板下载关于做外汇现货的网站
  • 成都做网站做的好的公司电商网站开发平台实验
  • 做网站的是什么工种找人做网站都需要提供什么
  • 电子商务网站建设系统特点长沙房价走势最新消息
  • 企业网站怎么建立app开发过程中的困难
  • 惠民县建设网站大家都用哪个网站做读书笔记
  • 伍佰亿是什么网站内蒙古建设工程造价信息网官网
  • 兰州新区农投建设网站资源软件库
  • 外贸网站建设厦门南沙做网站
  • 甘肃 网站建设 开发 app投票网站源码php
  • 陕西网站制作qq群石佛营网站建设
  • seo优化网站技术排名百度推广企业网站的基本功能有哪些
  • 网站建设思想重视不够网站分几种类型
  • 开发软件网站建设asp网站开发实例pdf
  • 网站建设的广告语html网页爱心代码
  • 怎样看网站的浏览量eclipse 网站开发源码
  • 展示型网站和官网wordpress自定义统计
  • 网站横幅代码建设企业网站怎么样
  • 网站名称注册保护嵌入式开发手软件
  • python 做网站很快吗昆山市建设监察大队官方网站