网站开发工作周记,只会网站开发能创业吗,顺企网南昌网站建设,建设通查项目经理1. 什么是AI Agent#xff1f;
AI Agent可以理解为一个智能体#xff0c;包括感知模块、规划决策模块和行动模块#xff0c;类似于人类的五官、大脑和肢体。它能帮助人类处理复杂的任务#xff0c;并能根据环境反馈进行学习和调整。
五官可以理解为感知模块#xff0c;大…1. 什么是AI Agent
AI Agent可以理解为一个智能体包括感知模块、规划决策模块和行动模块类似于人类的五官、大脑和肢体。它能帮助人类处理复杂的任务并能根据环境反馈进行学习和调整。
五官可以理解为感知模块大脑为规划决策模块肢体是行动模块。如图 **举个例子**用手摸了一下电线感知模块被电麻了此时大脑决策规划模块发出信号把手拿走快逃。接着行动模块控制手从电线上拿开当然也可能拿不开这就是资料里常见的模型。将这个过程抽象出来如图 可以看到最关键的部分就是大脑部分即规划决策模块。以前这儿比较薄弱只有状态、记忆如今有了大模型让上述框架变得强大了起来。暂时忽略感知和反馈模块突出大模型LLM的作用如图 再将其抽取整理如图 从细节角度进行梳几个模块
1.1 记忆模块
又分为短期记忆和长期记忆如上下文学习就是短期记忆一般被上下文窗口长度限制长期记忆则保存较长时间一般外部向量保存。注意从某种程度上感知也可以归类在记忆模块里如视觉、听觉、触觉等。短期记忆如同电脑中的内存在LLM中受到Transformer和上下文窗口长度的限制长期记忆可以理解为硬盘包含陈述式记忆和如事件或事实程序式记忆如打字技能等。整理后如图
1.2 规划决策模块
包含四个模块其中思维链和子目标分解是为了处理更为复杂的任务反思和自我批评模块能从错误中吸取教训提高结果质量。整理后如图
1.3 工具模块
强调软件、API的调用如日历、计算器、代码解释器、搜索等目的是为了解决实际问题。整理后如图 总计一下当给予一个promptLLM记忆模块的短期记忆和长期记忆相互配合对任务进行分解并对错误进行反思、批评纠正最终做出了规划决策然后调用合适的外部工具并最后付出行动。
2. Agent与LLM之间的关系
上述过程中GPT扮演了大脑的角色其他模块扮演了其他的协同配合从而突破了简单的问答工作。在这儿插播一张图 是不是有些熟悉了回到了最经典的结构总结成公式即 A g e n t L L M 记忆 规划决策 工具使用 Agent LLM 记忆 规划决策 工具使用 AgentLLM记忆规划决策工具使用
3. AI Agent能起到什么实际作用
引用一个HuggingFace的案例。HuggingFace上有很多有趣的模型一般新手不知道怎么选择模型提出的HuggingGPT(Shen et al. 2023)就是一个AI Agent借助ChatGPT根据描述选择可用模型并执行。
在这个过程中包含四个阶段
任务的规划LLM做大脑任务请求分为多个任务。包括任务类型、ID、依赖项和参数。模型选择Agent根据模型ID选择对应模型处理用户请求。此处可以选择多个模型。任务执行执行特定的每个模型并记录结果。响应生成LLM接受执行结果汇总至用户。
过程汇总如图 这就是一个比较有趣且好玩的Agent实践案例。 类似的项目还有很多如ChatDev、AutoGPT、GPT-engineer
4. 如何上手学习
LLM是核心底层是Transformer和LLaMA搞定就ok当然Attention可以作为知识扩展进行学习。 感知部分是多模态涉及的就是深度学习里的强化学习。
参考
动画科普AI AgentAI Agent或者LLM Agent深度讲解LLM Powered Autonomous AgentsAI Agent为什么是AIGC最后的杀手锏