AI Agent 技术发展与应用综述
AI Agent 技术发展与应用综述
摘要
人工智能体(AI Agent)是人工智能领域最核心的研究方向之一。从1956年的逻辑理论机到2026年的大语言模型驱动自主体,AI Agent走过了七十年。本文系统回顾AI Agent的核心架构、认知框架、工具使用、多智能体协作等关键技术,并分析了当前面临的挑战与未来方向。
关键词:AI Agent;大语言模型;多智能体系统;工具学习;自主推理
1 引言
AI Agent的研究可以追溯到人工智能诞生之初。Newell和Simon在1956年提出的逻辑理论机(Logic Theory Machine)被认为是第一个AI Agent的雏形[1]。此后,从STRIPS规划系统[2]到SOAR认知架构[3],从Brooks的包容式架构[4]到BDI模型[7],AI Agent的研究经历了符号主义、行为主义到混合架构的多次范式转换。每一次范式转换的本质都是在回答同一个核心问题:智能体如何从感知输入中构建内部世界模型,并利用该模型进行推理、规划和决策。
2020年代,大语言模型(LLM)的出现为AI Agent带来了革命性的能力跃迁。ReAct[8]、AutoGen[9]、MemGPT[10]等框架将LLM的推理能力与工具使用、记忆管理和多智能体协作相结合,极大地拓展了AI Agent的能力边界。这一轮LLM Agent浪潮的核心特征在于,将传统的符号推理能力(规划、搜索、工具调用)与大语言模型的自然语言理解与生成能力进行了深度耦合,形成了一种被称为"符号神经混合系统"的新范式。
2 AI Agent的核心架构
2.1 认知架构的理论演化
AI Agent的认知架构经历了从符号系统到神经符号系统的演变。SOAR架构(State, Operator, And Result)由Laird、Newell和Rosenbloom于1987年提出,是以物理符号系统假设(Physical Symbol System Hypothesis)为基础的通用认知架构[3]。SOAR的核心机制是"通用问题空间"——所有知识被表示为产生式规则(Production Rules),推理过程通过"状态-算子-结果"的循环迭代完成。当遇到知识不足导致决策冲突时,SOAR自动进入"僵局"(Impassse)状态,触发子目标求解过程。
BDI模型(Belief-Desire-Intention)由Rao和Georgeff于1995年提出,是Agent理论中最有影响力的意图模型之一[7]。BDI将Agent的认知状态划分为信念(Belief, 对世界的认识)、愿望(Desire, 希望达到的状态)和意图(Intention, 承诺执行的动作序列)三个层面。BDI模型的工程实现——如JASON和JADE框架——在机器人协作和军事仿真等领域得到了验证。
近年来,基于LLM的认知架构将大语言模型作为核心推理引擎。Sumers等人的Cognitive Architectures for Language Agents[11]系统提出了一个统一框架(CoALA),将语言Agent的认知过程分为感知、推理、记忆和行动四个模块。CoALA框架的重要理论贡献在于区分了"工作记忆"(Working Memory, 当前会话的上下文窗口)和"长期记忆"(Long-term Memory, 外部知识库/文档存储),并将LLM的token-level推理视为一种受限于工作记忆容量的系统2(慢速、分析性)过程。
2.2 推理与规划:从Chain-of-Thought到搜索增强
Chain-of-Thought(CoT)提示方法由Wei等人在2022年提出[21],通过在提示中嵌入"逐步推理"的示例,引导LLM从直接输出答案转向生成中间推理步骤。CoT的数学本质可以理解为一种隐式的程序合成——将多步推理问题分解为一系列更简单的子问题,每个子问题的解答依赖于前一步的输出。CoT在GSM8K数学推理基准上将PaLM 540B的零样本准确率从17.9%提升至58.1%,证明了该方法对于需要多步逻辑链的任务具有显著效果。
Tree of Thoughts(ToT)由Yao等人在2023年提出[13],将CoT的单链推理扩展为树状搜索。在ToT框架中,Agent在推理的每个决策点生成多个候选思想(Thoughts),通过广度优先搜索(BFS)或深度优先搜索(DFS)在思想树中探索最优路径。ToT在24点游戏和创意写作任务中显著超越了CoT的性能,但其搜索复杂度随搜索深度和分支因子指数增长,在大规模问题上面临计算可行性挑战。
Plan-and-Solve[12]和LLM+P[14]等框架进一步将规划能力显式集成到Agent中。LLM+P采用"规划-执行"分离架构:将问题描述转化为PDDL(Planning Domain Definition Language)表示,调用外部经典规划器(如Fast Downward)生成动作序列。这一方法在约束满足型任务(如任务调度、路径规划)中表现优异,但在需要常识推理和动态适应的半结构化问题上,PDDL的完备表示假设往往难以满足。
2.3 工具使用:从Toolformer到函数调用协议
Toolformer由Schick等人于2023年提出[17],通过自监督方式训练LLM学习使用外部工具(计算器、搜索引擎、日历API等)。其核心思路是在文本语料中自动标注需要调用工具的"缺口"位置,随后通过解码时调用工具并填充结果来完成训练。Toolformer在零样本设置下使LLM的数学推理(Mathematical reasoning)准确率提升了约25%,但该方法要求每个工具的函数签名和API格式在训练前已知,限制了其泛化到新工具的能力。
Gorilla[18]通过检索增强生成(RAG)的方式解决了这一问题——Gorilla维护一个动态更新的工具API文档库,在推理时根据用户查询检索相关工具的调用规范,然后将检索结果作为上下文拼接进LLM的输入。在Torch Hub、Hugging Face和TensorFlow Hub三大API库的基准测试中,Gorilla的API调用准确率达到了85%以上,远优于未使用RAG的基线方案(约55%)。
OpenAI Operator[19]提出了强化学习微调(RLHF)的Agent版本——利用浏览器的DOM(Document Object Model)结构作为交互接口,将网页操作(点击、输入、滚动)抽象为API调用。Operator在WebArena基准上的成功率为58.3%,较此前最优方法提升了约20个百分点。
2.4 多智能体协作:从对话到辩论与共识
多智能体协作的三种基本范式包括:
对话式协作——AutoGen[9]是对话式多智能体框架的代表,通过定义智能体之间的角色(如"工程师Agent"、"评审Agent"、"用户代理Agent")和消息传递协议,允许多个LLM驱动的Agent通过多轮对话协作完成复杂任务。AutoGen的消融实验表明,引入一个"批判性Agent"(Critic)将代码生成任务的首次成功运行率从37%提升至62%。
辩论式协作——AgentVerse[20]将多智能体之间的交互建模为迭代辩论过程——协作Agent们就同一个问题的多个候选解答进行多轮批评和修订,最终通过投票或加权共识选择最佳解答。在AlfWorld家居任务规划场景下,辩论式协作使任务完成率从单Agent的45%提升至72%。
社会模拟——Generative Agents by Park等人[16]创建了一个包含25个Agent的小镇社会模拟系统,每个Agent拥有独立的身份、记忆和日常计划。Agent们之间通过自然语言交流形成社交网络,甚至在实验期间"自发"策划了情人节派对。这一研究的重要意义在于证明了LLM Agent可以展现出涌现社会行为(Emergent Social Behavior)——智能体在宏观层面的集体行为模式无法从单个Agent的微观规则直接预测。
3 关键技术与方法
3.1 反射与自我改进
Reflexion[15]提出了基于语言反馈的自我改进机制:Agent在执行任务后生成语言描述的执行轨迹(Trajectory),将其与任务目标进行对比,识别失败原因,然后根据这一反思信号调整后续行动策略。在AlfWorld和HotPotQA基准测试中,Reflexion使单次执行成功率提升了20%以上。Constitutional AI[24]通过原则引导的方法确保Agent行为的安全性——定义一组宪章原则(如"不要生成有害内容"),Agent在生成输出后通过自我修订(Self-revision)使其与宪章原则对齐。
3.2 评估基准体系
AI Agent评估是当前最活跃的研究方向之一。AgentBench[25]由清华大学和微软研究院联合提出,构建了标准化的多维评估框架,涵盖操作系统、数据库、网络、Web浏览、游戏等8个真实交互环境。在AgentBench v0.2中,GPT-4在Web浏览子任务上的成功率仅为43%,而专用WebAgent通过结构化HTML解析与计划分解,将成功率提升至67%。这一差距揭示了通用LLM在长序列决策场景中的能力边界。
SWE-Bench是近年来最具影响力的AI软件工程评估基准,从Python开源仓库中选取了2,294个真实GitHub Issue,要求Agent在理解问题描述后定位代码、修改并通过单元测试。Devin[26]在SWE-Bench上报告了13.86%的解决率,而2025年底发布的SWE-Agent通过将代码编辑分解为搜索、编辑、检查三个原子动作,将解决率提升至34.2%。
GAIA(General AI Assistants Benchmark)由Meta FAIR和Hugging Face联合提出,评估通用AI助手在真实世界多模态任务中的能力,包括推理工具调用、多步规划、多模态理解和信息检索的复合能力。在GAIA验证集上,人类平均准确率为92%,而最佳AI系统仅为47%[27]。
3.3 具身Agent与物理世界交互
具身Agent(Embodied Agent)将AI能力从数字空间扩展到物理世界。Google DeepMind的RT-2[22]提出了视觉-语言-动作(VLA)模型,将视觉-语言模型直接微调至机器人动作空间,在660次真实机器人操作实验中达到75%成功率。PALM-E展示了将540B参数语言模型与22B参数视觉编码器在具身Agent中的集成[28]。
4 挑战与展望
AI Agent面临安全性、可靠性和可控性三大核心挑战。安全性方面,Agent通过外部工具与真实世界交互引入了在传统LLM中不存在的攻击面——间接提示注入可以隐藏在搜索引擎结果或API响应中。可靠性和可控性方面,Agent在复杂任务上的"幻觉传播"仍然是开放问题——早期推理步骤中的微小错误可能在后续步骤中被放大。RT-2[22]等具身Agent将AI的能力扩展到物理世界,但其物理安全性验证比纯软件Agent更为严格。
展望未来,AI Agent将沿着三个方向加速演进:从单智能体到多智能体生态、从对话式交互到自主执行、从软件世界到物理世界的扩展。Agent-Computer Interface(ACI)的标准化[26]和安全对齐的方法论完善将是决定AI Agent能否从研究走向产业落地的关键因素。
参考文献
[1] Newell, A., & Simon, H. A. (1956). The logic theory machine. IRE Transactions on Information Theory, 2(3), 61-79.
[2] Fikes, R. E., & Nilsson, N. J. (1971). STRIPS. Artificial Intelligence, 2(3-4), 189-208.
[3] Laird, J. E., Newell, A., & Rosenbloom, P. S. (1987). SOAR. Artificial Intelligence, 33(1), 1-64.
[4] Brooks, R. A. (1986). A robust layered control system for a mobile robot. IEEE Journal on Robotics and Automation, 2(1), 14-23.
[7] Rao, A. S., & Georgeff, M. P. (1995). BDI agents. ICMAS, 312-319.
[8] Yao, S., et al. (2023). ReAct. ICLR 2023. arXiv: 2210.03629
[9] Wu, Q., et al. (2023). AutoGen. arXiv: 2308.08155
[10] Packer, C., et al. (2023). MemGPT. arXiv: 2310.08560
[11] Sumers, T. R., et al. (2024). Cognitive architectures for language agents. arXiv: [2309.02427](https://arxiv.org/abs/2309.02427
[12] Wang, L., et al. (2023). Plan-and-Solve. ACL 2023. arXiv: 2305.04091
[13] Yao, S., et al. (2023). Tree of Thoughts. NeurIPS 2023. arXiv: 2305.10601
[14] Silver, T., et al. (2024). LLM+P. ICRA 2024. arXiv: 2304.11477
[15] Shinn, N., et al. (2023). Reflexion. NeurIPS 2023. arXiv: 2303.11366
[16] Park, J. S., et al. (2023). Generative Agents. UIST 2023. arXiv: 2304.03442
[17] Schick, T., et al. (2023). Toolformer. NeurIPS 2023. arXiv: 2302.04761
[18] Patil, S. G., et al. (2023). Gorilla. arXiv: 2305.15334
[19] OpenAI. (2024). Introducing Operator. OpenAI Blog. operator.chatgpt.com
[20] Tao, M., et al. (2024). AgentVerse. ICLR 2024. arXiv: 2307.05483
[21] Wei, J., et al. (2022). Chain-of-Thought. NeurIPS 2022. arXiv: 2201.11903
[22] Brohan, A., et al. (2023). RT-2. arXiv: 2307.15818
[23] European Commission. (2024). EU AI Act. Official Journal of the EU.
[24] Bai, Y., et al. (2022). Constitutional AI. arXiv: 2212.08073
[25] Liu, X., et al. (2023). AgentBench. ICLR 2024. arXiv: 2308.03688
[26] Cognition Labs. (2024). Introducing Devin: The first AI software engineer. Cognition Blog. URL: https://www.cognition.ai/blog/introducing-devin
[27] Mialon G, et al. (2023). GAIA: A benchmark for general AI assistants. NeurIPS 2023 Datasets & Benchmarks. arXiv: 2311.12983
[28] Driess D, et al. (2023). PaLM-E: An embodied multimodal language model. ICML 2023. arXiv: 2303.03378
[29] Xi Z, Chen W, et al. (2023). The rise and potential of large language model based agents: A survey. arXiv: 2309.07864. URL: https://arxiv.org/abs/2309.07864
[30] Wang L, et al. (2024). A survey on large language model based autonomous agents. Frontiers of Computer Science, 18(6): 186901