网站一般用什么服务器,怎么将自己做的网站上线,公司简介电子版宣传册模板,网站 风格AI 探索
用 LLM 构建企业专属的用户助手#xff1a;很好的 LLM 应用工程实践#xff0c;主要介绍了 PingCAP 如何使用大型语言模型#xff08;Large Language Model#xff0c;LLM#xff09;构建一个搭载企业专属知识库的智能客服机器人。除了采用行业内通行的基于知识库…AI 探索
用 LLM 构建企业专属的用户助手很好的 LLM 应用工程实践主要介绍了 PingCAP 如何使用大型语言模型Large Language ModelLLM构建一个搭载企业专属知识库的智能客服机器人。除了采用行业内通行的基于知识库的问题解答方法还尝试让模型在“小样本Few-Shot”学习下进行不良毒性内容识别如何对机器人性能进行优化以提高准确度包括解决“不准确的不良毒性内容识别”、“上下文理解错误”、“语义搜索结果不精确”以及“文档信息不足或过时”等问题。LightLLM纯Python超轻量高性能LLM推理框架大语言模型受到越来越多的关注极大的提高了人们的工作效率然而如何低成本、高吞吐的将参数量动辄千亿的模型部署到各类服务器上成为将技术进一步大范围推广的关键本文比较了LightLLMFasterTransformerText-Generation-Inference(简称TGI)vLLM几个流行推理框架。AI 推理加速原理解析与工程实践分享AI 推理是指将用户输入的数据通过训练好的模型产生有价值信息的过程。具体的是将训练好的 AI 模型部署到提供算力的硬件上并通过 HTTP/RPC 等接口对外提供服务对 AI 算法工程师来说他们希望自己训练的复杂模型可以更快的提供服务而对于基础架构工程师来说他们则希望可以将价格昂贵的 GPU 资源发挥出最好的效能本文就探讨了这两类问题的解决思路。
开源推荐
NLP民工的乐园一个markdown项目几乎是最全的中文NLP资源库索引了。guidance一个解决LLM可控输出的项目通过“模板语言”来定义 LLM 的输出结构以确保输出格式的正确性。
工程师工具
ReadPaper集翻译、阅读、搜索、管理等于一体的专业科研神器特别是多人共读论文场景协作方面很强大。DevPodGithub CodespacesJetbrains Spaces或Google Cloud Workstation这一类产品可选替代支持VSCode和完整的Jetbrains套件支持主流的云厂商服务器、Kubernetes 集群以及本地笔记本电脑。llm.report可以通过对 OpenAI 的 API 请求日志进行记录能够分析成本并改进提示此类的产品现在很多但是这款做的最好看数据分析的也最全面。Cerelyze将技术研究论文转化为可用的代码ReadPaper Copilot工具值得关注。
值得一看
《DevOps实践指南》以流动、反馈、持续学习和实验 三步工作法作为 DevOps的基础原则然后针对每个环节遇到的问题针对性提出一些技术实践适合有一定工作经验的软件工程参与者阅读才会对一些问题感同深受。DevOps是一种很好的团队文化但是不得不说对个人的要求很高我的理解就是能流程化的一定要通过技术改造为自动化价值流上参与的每个个人做到凡事有交代件件有着落事事有回音这样的团队肯定会高效方法论固然好还是在于人的执行很值得一读。在团队协作中以这样的理念来要求自己做齿轮不做螺丝钉。Matrices and graphs作者把矩阵转换为有向加权图进行定理推导思路很有意思。