当前位置: 首页 > news >正文

网页网站设计公司wordpress可以装多少会员数据库

网页网站设计公司,wordpress可以装多少会员数据库,dedecms源码,微信公众号怎么二次开发RAG#xff08;Retrieval-Augmented Generation#xff09;是一种结合检索和生成能力的技术框架#xff0c;旨在通过从外部知识库中检索相关信息来增强生成模型的输出。其基本思想是利用大型语言模型#xff08;LLM#xff09;的生成能力#xff0c;同时通过检索机制获取…RAGRetrieval-Augmented Generation是一种结合检索和生成能力的技术框架旨在通过从外部知识库中检索相关信息来增强生成模型的输出。其基本思想是利用大型语言模型LLM的生成能力同时通过检索机制获取更准确和相关的信息从而提高生成内容的质量和准确性。RAG的应用场景广泛尤其适用于需要结合外部知识或实时信息的任务如问答系统、信息摘要和聊天机器人等。 传统模型通常被视为黑盒因为它们的内部机制和决策过程对用户而言是不透明的。这种不透明性使得用户难以理解和解释模型的输出尤其是在复杂任务或大量数据处理的情况下。正是在这样的背景下检索增强生成技术Retrieval-Augmented GenerationRAG应时而生成为LLM时代的一大趋势。 下边我们将从RAG的每个环节来探讨如何优化RAG的效果。 文本预处理 实体解析消除实体术语的歧义实现实体和术语的一致性。例如RAG、检索增强生成等。文档划分合理的区分不同主题文档。如果人类无法区分那么检索系统也不行。例如上课安排相关、售卖相关等。数据增强简单的理解就是数据够多。扩充检索系统使其可以理解同义词、词汇意思的解释等数据过期机制多变的数据要能过期或者更新。增加周边数据例如摘要、时间、问题的附加信息等。 文本分割 因为文本长度通常非常长可能回超过LLM所能承受的上限所以要对文本进行分割。理想的情况是在不超过LLM输入长度上限的基础上每个分割的块trunking内部是一致的块之间是有差异的。这样的好处是可以尽量的提供给LLM有效信息而不会分散其注意力。常用的分割方法有以下几种 根据长度分割。例如设定每个块512个token然后分割的每个块保证不超过512个token。可以通过OpenAI的相关库来计算token。还有一种方法也是比较常用的就是后一个块包含前一个块的部分内容。按照句子进行分割。这部分可以通过NLTK等库来做。基于段落分割然后在基于行分割。在dify中就有类似的分割方式实现。例如线根据\n\n进行按段分割。如果超长度再根据\n分割。自定义分割。自己可以根据数据类型进行分割。例如word、excel或者JSON这样的数据可能就会根据其自身需要进行分割。基于语义分割。这种方法的目的还是要保证块内部信息的一致性。我们可以简单的理解就是先对文本分成句子然后根据前后句子的相关度来进行合并。具体方法有可以依据嵌入的方法在langchain有实现、基于模型的方法以及基于LLM的方法实际就是让模型帮我们分段 Embedding嵌入 尽可能使用动态嵌入。一开始看到这个词可能会比较蒙。实际非常好理解他和静态嵌入的区别就在于是否可以捕获上下文信息然后根据上下文信息使得每个词有不同的含义。例如打飞机可能在不通的语境中含义是不一样的。bert就是动态嵌入因为它引入了多头自注意力机制self-attention。Word2Vec就是静态嵌入。微调嵌入。这个上手较高主要是对垂类数据来说的。大多数模型都是基于通用语料库进行训练为了让嵌入有更好的效果可以对垂类数据的训练。增加模型对垂类领域数据的理解。混合嵌入。对不同问题或者不同的知识库使用不同的嵌入模型。 查询优化 利用LLM从不同的视角根据用户提出的问题生成多个问题。然后根据生成的问题进行查询。最后把所有的问题并集。理论上这对于解决复杂问题非常有用。 **HyDEQueryDoc。**使用假设文档嵌入 (HyDE) 改进检索增强生成。参考下边的两张图 传统检索和HyDE的区别 实现原理我们来解释一下这张图。1. 根据用户的问题使用类似于ChatGPT这样的模型进行寻找答案。 1. 根据ChatGPT生成的答案去嵌入。 1. 然后使用向量相似性去查询文档。注意原始问题不做查询。 1. 用检索到的结果来生成最终结果。详细信息可以阅读[**Advanced RAG: Improving Retrieval-Augmented Generation with Hypothetical Document Embeddings (HyDE)**](https://www.pondhouse-data.com/blog/advanced-rag-hypothetical-document-embeddings/)这总方法也并非总是有效如果模型对知识了解较少则问题较大。 Back Prompting。后退提示法指导 LLM 首先从给定的细节中提取高级概念和原则然后使用这些概念引导其推理得到正确的解决方案。这种提示法基于以下事实“在关键决策中人类发现抽象很有帮助因为它提供了对环境的更广阔的视野”。例如我想知道汉武帝某个时间段的成就就可以想让模型给出汉武帝的所有经历然后再给出答案。 检索 检索的目的是确保最终的答案出现在候选列表中。 句子窗口搜索。这个本质不是一种检索优化。核心原理是就是检索到相应结果后把周边数据一并提交给LLM增加LLM对问答案的理解。使用Agent。这个方法就是使用Agent决定应该采用什么样的索引的方法。例如根据问题选择不同的专注于不同领域的索引。混合检索。为了提高查询的**召回率**可以采用向量索引和关键词检索的方法来组合RAG的检索功能。因为在RAG的搜索方法中大部分的场景的主要目的还是确保结果出现在候选列表中。 检索后处理 检索后处理比较典型的方法就是Rerank。核心思想是利用专有模型对结果进行重新排序。这些模型会对结果进行更深入的相关度的理解然后重新排序。确保相关对最高的答案排在最前面以便于LLM更好的输出答案。 生成 生成这部分重点要考虑的是体验。比较简单的方式就是根据检索后的结果进行润色、整理然后输出给用户但也可能存在无法找到答案的场景这时候就要引导用户进行多轮对话来进行问题以及上下文的理解。涉及到一下基本部分。 如果问题不够清晰进行多轮用户对话引导对问题进行追问或者采用其它策略结束会话。建立科学的用户反馈录入机制。根据用户反馈的答案进行知识库更新。 大模型AI产品经理如何学习 求大家的点赞和收藏我花2万买的大模型学习资料免费共享给你们来看看有哪些东西。 1.学习路线图 第一阶段 从大模型系统设计入手讲解大模型的主要方法 第二阶段 在通过大模型提示词工程从Prompts角度入手更好发挥模型的作用 第三阶段 大模型平台应用开发借助阿里云PAI平台构建电商领域虚拟试衣系统 第四阶段 大模型知识库应用开发以LangChain框架为例构建物流行业咨询智能问答系统 第五阶段 大模型微调开发借助以大健康、新零售、新媒体领域构建适合当前领域大模型 第六阶段 以SD多模态大模型为主搭建了文生图小程序案例 第七阶段 以大模型平台应用与开发为主通过星火大模型文心大模型等成熟大模型构建大模型行业应用。 2.视频教程 网上虽然也有很多的学习资源但基本上都残缺不全的这是我自己整理的大模型视频教程上面路线图的每一个知识点我都有配套的视频讲解。 都打包成一块的了不能一一展开总共300多集 因篇幅有限仅展示部分资料需要点击下方图片前往获取 3.技术文档和电子书 这里主要整理了大模型相关PDF书籍、行业报告、文档有几百本都是目前行业最新的。 4.LLM面试题和面经合集 这里主要整理了行业目前最新的大模型面试题和各种大厂offer面经合集。 学会后的收获 • 基于大模型全栈工程实现前端、后端、产品经理、设计、数据分析等通过这门课可获得不同能力 • 能够利用大模型解决相关实际项目需求 大数据时代越来越多的企业和机构需要处理海量数据利用大模型技术可以更好地处理这些数据提高数据分析和决策的准确性。因此掌握大模型应用开发技能可以让程序员更好地应对实际项目需求 • 基于大模型和企业数据AI应用开发实现大模型理论、掌握GPU算力、硬件、LangChain开发框架和项目实战技能 学会Fine-tuning垂直训练大模型数据准备、数据蒸馏、大模型部署一站式掌握 • 能够完成时下热门大模型垂直领域模型训练能力提高程序员的编码能力 大模型应用开发需要掌握机器学习算法、深度学习框架等技术这些技术的掌握可以提高程序员的编码能力和分析能力让程序员更加熟练地编写高质量的代码。 1.AI大模型学习路线图 2.100套AI大模型商业化落地方案 3.100集大模型视频教程 4.200本大模型PDF书籍 5.LLM面试题合集 6.AI产品经理资源合集 获取方式 有需要的小伙伴可以保存图片到wx扫描二v码免费领取【保证100%免费】
http://www.hkea.cn/news/14564727/

相关文章:

  • 个人网站建设方案书框架栏目建立自己的网站平台的好处
  • 湖北联兴建设有限公司网站民宿网络营销方式
  • 北京网站页设计制作wordpress 暂时关闭
  • 厂家高端网站设计地址钢筋网片厂家电话
  • 台州seo网站管理企业融资计划书
  • 常州市建设局网站高端网站设计企业
  • c 网站做微信支付功能作风建设简报--门户网站
  • 网站怎么添加手机版凡科建站源码
  • 做网站设计电脑需要什么配置电子商务公司属于什么行业
  • 快速搭建网站页面重庆娱乐场所最新通知
  • 咖啡网站建设策划书a做爰网站
  • 毕设帮做网站如何建设个人网站和博客
  • 网页升级访问站作一个网站要多少钱
  • 如何看网站的关键词东莞做商城网站建设哪家好
  • 亚马逊品牌网站要怎么做织梦末班和dw建设网站哪个方便优化
  • 可以自己做装修效果图的网站旅游项目网站开发
  • 淘宝联盟建微网站导视设计书籍
  • 建设银行内部网站源码小程序链接如何转成网页链接
  • 网站设计的难点建网站内容
  • 做视频网站公司要怎么做微信精准推广
  • 江苏省交通建设局网站首页软文营销的缺点
  • 网站建设方案合同南山做网站多少钱
  • 怎样增加网站浏览量seo综合查询站长工具关键词
  • 免费的微网站博物馆网站建设目的
  • 营销网站的关键字wordpress免费教育主题
  • 淘客网站怎么做代理邯郸信息港官网登录
  • 上海 科技网站建设巴中移动网站建设
  • 网站后台登陆代码南京网站建设公司 w
  • 做平面vi网站wordpress 京东主题
  • 做pc端大型网站+前端用关于官方网站建设情况的汇报