当前位置: 首页 > news >正文

自主网站建站桂林漓江官网

自主网站建站,桂林漓江官网,创建公司网站需要什么,网络推广方案下拉管家微xiala11今天分享的是苏黎世联邦理工学院、华沙理工大学和Cledar联合发表的一篇文章#xff1a;思维图#xff1a;用大语言模型解决复杂问题 论文题目#xff1a;Graph of Thoughts: Solving Elaborate Problems with Large Language Models 论文链接#xff1a;https://arxiv.or…今天分享的是苏黎世联邦理工学院、华沙理工大学和Cledar联合发表的一篇文章思维图用大语言模型解决复杂问题 论文题目Graph of Thoughts: Solving Elaborate Problems with Large Language Models 论文链接https://arxiv.org/pdf/2308.09687 代码地址https://github.com/spcl/graph-of-thoughts 论文概述 人类在进行思考时不仅仅只遵循一条思维链也不是像思维树那样尝试多种不同途径而是会形成一个更加复杂的思维网。举个例子一个人可能会先探索一条思维链然后回溯再探索另一条然后可能会意识到之前那条链的某个想法可以和当前链结合起来取长补短得到一个新的解决方案。类似地大脑会形成复杂的网络呈现出类似图的模式比如循环模式。 这篇论文介绍了一种名为“思维图谱”简称GoT的框架它通过将信息生成建模为任意图来增强大型语言模型的提示能力。在这个框架中信息单元即“LLM思考”被视为顶点而边对应于这些顶点之间的依赖关系。这种方法允许将任意的LLM思考结合起来形成协同效应提取整个思考网络的本质或使用反馈循环增强思考。 论文核心 用户与LLM对话的过程主要包括用户消息提示prompts和模型回复思维、想法thoughts其中回复可以是一段文本摘要任务、一个文档生成任务或是一个代码块等。 为了充分激活语言模型的能力通常会采用各种提示方法 输入到输出提示Input-Output, IO 输入序列后直接用语言模型获取输出不添加任何中间思考过程。思维链Chain-of-Thought, CoT在输入和输出之间引入多个中间思维状态相比IO方法可以显著提升语言模型在数学难题和通用推理任务上的性能。多思维链Multiple CoTs独立生成多条思维链然后根据预先指定的评分指标返回最佳输出结果的思维链。思维树Tree of Thoughts, ToTToT将过程或推理建模为一棵思维树来增强CoT-SC方法单个树节点代表部分解决方案基于给定的节点思维生成器thought generator可以构造出一定数量的新节点然后用状态评估器state evaluator为每个新节点生成相应评分。 思维图GOT框架 GoT可以被建模为一个四元组(G, T, E, R)其中G是“LLM推理过程”即上下文中的所有LLM思维及其关系T是潜在的思维转换E是用于获取思维得分的评估函数R是用于选择最相关思维的排名函数。 LLM 的推理过程表示为有向图。该图中的每个节点对应于LLMs生成的单个想法边代表想法之间的关系。也就是说从思想a到b的边——或者图中的有向边 (a, b)——简单地告诉思想 b 是使用思想 a 作为输入生成的。与 ToT 提示类似想法的确切定义取决于要解决的问题。更进一步每个节点代表问题的可能是中间的解决方案但我们可以在图中使用不同类型的节点来代表推理过程的不同方面例如计划与执行。 提示器Prompter为LLM准备信息主要负责把图结构编码进提示词中GoT架构允许用户根据不同用例实现不同的图编码提供全部图结构访问权限。解析器Parser从LLM的回复中抽取信息解析器为每个思维构造出一个思维状态thought state包含了抽取出的信息并用于后续状态更新。评分模块Scoring对LLM回复进行验证和评分验证一个给定的LLM思维是否能够满足潜在的正确性条件然后对思维进行打分。控制器Controller协调整个推理过程并决定如何继续推理控制器中包含两个重要组件图操作the Graph of Operations, GoO和图推理状态GRS。其中GoO是一个静态结构指定了给定任务上的图分解过程即规定了可用于LLM思维转换的操作以及思维之间的顺序和依赖关系每个操作对象都知道自己的前置操作和后继操作。GRS是一个动态结构用来维护LLM推理过程进行中的状态包括所有思维的历史及状态。 思维图GOT排序示例 使用到的操作包括生成Generate、聚合Aggregate、评分Score、保留最优KeepBest。具体的prompt在论文中都有附录。 生成Generate操作将包含64个元素的输入数组分割成四个每个包含16个元素的块只重复一次。排序sort)操作针对分割好的序列排序k3 表示对于每个包含16个元素的块生成三种不同的排序结果。评分Score为了获得评分对于每一个数字0到9计算输入数组与排序后的数组之间的差异并将这10个值相加。差值为零表示已正确排序。保留最优KeepBest保留最好的排序序列。聚合Aggregate聚合成最终的序列。 论文实验 与现有技术相比在对排序任务进行评估时可以发现与 CoT 、具有自洽性的 CoT 或 ToT 提示等技术相比GoT 提示始终产生更少的错误。 论文总结 提示工程是大型语言模型LLM研究的中心新领域之一。它使得能够高效地使用LLM无需任何模型更新。然而设计有效的提示是一项具有挑战性的任务。人类的任务解决通常是非线性的它涉及将中间解决方案合并为最终解决方案或在发现新见解时改变推理的流程。在这项工作中提出了“思维图”GoT使LLM能够有效地解决不同的任务而无需任何模型更新。其关键的想法是将LLM推理建模为一个任意图其中思维是顶点思维之间的依赖关系是边。这使得能够进行新的思维转换如聚合。并且和现有提示方案相比如ToT图提示的排序质量和成本都是最优的。
http://www.hkea.cn/news/14297454/

相关文章:

  • 如何找人做网站网站建设 大纲
  • 做淘宝网站需要什么ppt设计说明
  • 企业网站的设计怎么做网站开发服务费属于哪种进项
  • 网站数据分析建设做网站的公司需要什么资质
  • 网站内容填写360建筑网怎么获得人才信息
  • 网站阵地建设管理建设通网站不良信用信息撤销
  • 网站建设需要经过哪几个步骤西乡做网站价格
  • 设计师可以接单的网站最大源码网站
  • 架设网站多少钱wordpress 管理员插件
  • 网站建设学习学校大港油田建设网站
  • 网站一般用什么服务器怎么将自己做的网站上线
  • 青海企业网站制作360ssp网站代做
  • 柏乡县网站建设wordpress用户投稿
  • 平面设计做兼职网站哪些ppt网站是免费的
  • w网站建设需求说明齐鲁石化建设公司官网
  • 建设征信注册中心网站wordpress适应ie6
  • 网站开发众筹自媒体创业
  • 觉得自己做的网站土怎么办陕西建设厅八大员官方网站
  • 银川网站建设多少钱巴中网站建设公司
  • 太原网站建设招聘网站模板哪个网站全面
  • 福建省建设工程资格中心网站网站上传好了如何做定向
  • 做跨境电商网站wordpress自己添加menu
  • 安顺网站开发公司阿里做的网站后台怎么进
  • 是用cms还是直接用语言写网站阿里 建设网站
  • 网站建设项目申请ppt网站免费服务器
  • 中国空间站设计在轨飞行几年和17做网店类似的货源网站
  • 东莞网站设计电话开封公司做网站
  • 游戏平台网站制作礼品行业网站建设
  • 社交网站 cms江苏工程建设标准网站
  • 上海制作网站的网站广告设计专业自我介绍