AI Agent 技术发展与应用综述

2026-05-28

3 min read

AI Agent 技术发展与应用综述

摘要

人工智能体（AI Agent）是人工智能领域最核心的研究方向之一。从1956年的逻辑理论机到2026年的大语言模型驱动自主体，AI Agent走过了七十年。本文系统回顾AI Agent的核心架构、认知框架、工具使用、多智能体协作等关键技术，并分析了当前面临的挑战与未来方向。

关键词：AI Agent；大语言模型；多智能体系统；工具学习；自主推理

1 引言

AI Agent的研究可以追溯到人工智能诞生之初。Newell和Simon在1956年提出的逻辑理论机（Logic Theory Machine）被认为是第一个AI Agent的雏形[1]。此后，从STRIPS规划系统[2]到SOAR认知架构[3]，从Brooks的包容式架构[4]到BDI模型[7]，AI Agent的研究经历了符号主义、行为主义到混合架构的多次范式转换。每一次范式转换的本质都是在回答同一个核心问题：智能体如何从感知输入中构建内部世界模型，并利用该模型进行推理、规划和决策。

2020年代，大语言模型（LLM）的出现为AI Agent带来了革命性的能力跃迁。ReAct[8]、AutoGen[9]、MemGPT[10]等框架将LLM的推理能力与工具使用、记忆管理和多智能体协作相结合，极大地拓展了AI Agent的能力边界。这一轮LLM Agent浪潮的核心特征在于，将传统的符号推理能力（规划、搜索、工具调用）与大语言模型的自然语言理解与生成能力进行了深度耦合，形成了一种被称为"符号神经混合系统"的新范式。

2 AI Agent的核心架构

2.1 认知架构的理论演化

AI Agent的认知架构经历了从符号系统到神经符号系统的演变。SOAR架构（State, Operator, And Result）由Laird、Newell和Rosenbloom于1987年提出，是以物理符号系统假设（Physical Symbol System Hypothesis）为基础的通用认知架构[3]。SOAR的核心机制是"通用问题空间"——所有知识被表示为产生式规则（Production Rules），推理过程通过"状态-算子-结果"的循环迭代完成。当遇到知识不足导致决策冲突时，SOAR自动进入"僵局"（Impassse）状态，触发子目标求解过程。

BDI模型（Belief-Desire-Intention）由Rao和Georgeff于1995年提出，是Agent理论中最有影响力的意图模型之一[7]。BDI将Agent的认知状态划分为信念（Belief, 对世界的认识）、愿望（Desire, 希望达到的状态）和意图（Intention, 承诺执行的动作序列）三个层面。BDI模型的工程实现——如JASON和JADE框架——在机器人协作和军事仿真等领域得到了验证。

近年来，基于LLM的认知架构将大语言模型作为核心推理引擎。Sumers等人的Cognitive Architectures for Language Agents[11]系统提出了一个统一框架（CoALA），将语言Agent的认知过程分为感知、推理、记忆和行动四个模块。CoALA框架的重要理论贡献在于区分了"工作记忆"（Working Memory, 当前会话的上下文窗口）和"长期记忆"（Long-term Memory, 外部知识库/文档存储），并将LLM的token-level推理视为一种受限于工作记忆容量的系统2（慢速、分析性）过程。

2.2 推理与规划：从Chain-of-Thought到搜索增强

Chain-of-Thought（CoT）提示方法由Wei等人在2022年提出[21]，通过在提示中嵌入"逐步推理"的示例，引导LLM从直接输出答案转向生成中间推理步骤。CoT的数学本质可以理解为一种隐式的程序合成——将多步推理问题分解为一系列更简单的子问题，每个子问题的解答依赖于前一步的输出。CoT在GSM8K数学推理基准上将PaLM 540B的零样本准确率从17.9%提升至58.1%，证明了该方法对于需要多步逻辑链的任务具有显著效果。

Tree of Thoughts（ToT）由Yao等人在2023年提出[13]，将CoT的单链推理扩展为树状搜索。在ToT框架中，Agent在推理的每个决策点生成多个候选思想（Thoughts），通过广度优先搜索（BFS）或深度优先搜索（DFS）在思想树中探索最优路径。ToT在24点游戏和创意写作任务中显著超越了CoT的性能，但其搜索复杂度随搜索深度和分支因子指数增长，在大规模问题上面临计算可行性挑战。

Plan-and-Solve[12]和LLM+P[14]等框架进一步将规划能力显式集成到Agent中。LLM+P采用"规划-执行"分离架构：将问题描述转化为PDDL（Planning Domain Definition Language）表示，调用外部经典规划器（如Fast Downward）生成动作序列。这一方法在约束满足型任务（如任务调度、路径规划）中表现优异，但在需要常识推理和动态适应的半结构化问题上，PDDL的完备表示假设往往难以满足。

2.3 工具使用：从Toolformer到函数调用协议

Toolformer由Schick等人于2023年提出[17]，通过自监督方式训练LLM学习使用外部工具（计算器、搜索引擎、日历API等）。其核心思路是在文本语料中自动标注需要调用工具的"缺口"位置，随后通过解码时调用工具并填充结果来完成训练。Toolformer在零样本设置下使LLM的数学推理（Mathematical reasoning）准确率提升了约25%，但该方法要求每个工具的函数签名和API格式在训练前已知，限制了其泛化到新工具的能力。

Gorilla[18]通过检索增强生成（RAG）的方式解决了这一问题——Gorilla维护一个动态更新的工具API文档库，在推理时根据用户查询检索相关工具的调用规范，然后将检索结果作为上下文拼接进LLM的输入。在Torch Hub、Hugging Face和TensorFlow Hub三大API库的基准测试中，Gorilla的API调用准确率达到了85%以上，远优于未使用RAG的基线方案（约55%）。

OpenAI Operator[19]提出了强化学习微调（RLHF）的Agent版本——利用浏览器的DOM（Document Object Model）结构作为交互接口，将网页操作（点击、输入、滚动）抽象为API调用。Operator在WebArena基准上的成功率为58.3%，较此前最优方法提升了约20个百分点。

2.4 多智能体协作：从对话到辩论与共识

多智能体协作的三种基本范式包括：

对话式协作——AutoGen[9]是对话式多智能体框架的代表，通过定义智能体之间的角色（如"工程师Agent"、"评审Agent"、"用户代理Agent"）和消息传递协议，允许多个LLM驱动的Agent通过多轮对话协作完成复杂任务。AutoGen的消融实验表明，引入一个"批判性Agent"（Critic）将代码生成任务的首次成功运行率从37%提升至62%。

辩论式协作——AgentVerse[20]将多智能体之间的交互建模为迭代辩论过程——协作Agent们就同一个问题的多个候选解答进行多轮批评和修订，最终通过投票或加权共识选择最佳解答。在AlfWorld家居任务规划场景下，辩论式协作使任务完成率从单Agent的45%提升至72%。

社会模拟——Generative Agents by Park等人[16]创建了一个包含25个Agent的小镇社会模拟系统，每个Agent拥有独立的身份、记忆和日常计划。Agent们之间通过自然语言交流形成社交网络，甚至在实验期间"自发"策划了情人节派对。这一研究的重要意义在于证明了LLM Agent可以展现出涌现社会行为（Emergent Social Behavior）——智能体在宏观层面的集体行为模式无法从单个Agent的微观规则直接预测。

3 关键技术与方法

3.1 反射与自我改进

Reflexion[15]提出了基于语言反馈的自我改进机制：Agent在执行任务后生成语言描述的执行轨迹（Trajectory），将其与任务目标进行对比，识别失败原因，然后根据这一反思信号调整后续行动策略。在AlfWorld和HotPotQA基准测试中，Reflexion使单次执行成功率提升了20%以上。Constitutional AI[24]通过原则引导的方法确保Agent行为的安全性——定义一组宪章原则（如"不要生成有害内容"），Agent在生成输出后通过自我修订（Self-revision）使其与宪章原则对齐。

3.2 评估基准体系

AI Agent评估是当前最活跃的研究方向之一。AgentBench[25]由清华大学和微软研究院联合提出，构建了标准化的多维评估框架，涵盖操作系统、数据库、网络、Web浏览、游戏等8个真实交互环境。在AgentBench v0.2中，GPT-4在Web浏览子任务上的成功率仅为43%，而专用WebAgent通过结构化HTML解析与计划分解，将成功率提升至67%。这一差距揭示了通用LLM在长序列决策场景中的能力边界。

SWE-Bench是近年来最具影响力的AI软件工程评估基准，从Python开源仓库中选取了2,294个真实GitHub Issue，要求Agent在理解问题描述后定位代码、修改并通过单元测试。Devin[26]在SWE-Bench上报告了13.86%的解决率，而2025年底发布的SWE-Agent通过将代码编辑分解为搜索、编辑、检查三个原子动作，将解决率提升至34.2%。

GAIA（General AI Assistants Benchmark）由Meta FAIR和Hugging Face联合提出，评估通用AI助手在真实世界多模态任务中的能力，包括推理工具调用、多步规划、多模态理解和信息检索的复合能力。在GAIA验证集上，人类平均准确率为92%，而最佳AI系统仅为47%[27]。

3.3 具身Agent与物理世界交互

具身Agent（Embodied Agent）将AI能力从数字空间扩展到物理世界。Google DeepMind的RT-2[22]提出了视觉-语言-动作（VLA）模型，将视觉-语言模型直接微调至机器人动作空间，在660次真实机器人操作实验中达到75%成功率。PALM-E展示了将540B参数语言模型与22B参数视觉编码器在具身Agent中的集成[28]。

4 挑战与展望

AI Agent面临安全性、可靠性和可控性三大核心挑战。安全性方面，Agent通过外部工具与真实世界交互引入了在传统LLM中不存在的攻击面——间接提示注入可以隐藏在搜索引擎结果或API响应中。可靠性和可控性方面，Agent在复杂任务上的"幻觉传播"仍然是开放问题——早期推理步骤中的微小错误可能在后续步骤中被放大。RT-2[22]等具身Agent将AI的能力扩展到物理世界，但其物理安全性验证比纯软件Agent更为严格。

展望未来，AI Agent将沿着三个方向加速演进：从单智能体到多智能体生态、从对话式交互到自主执行、从软件世界到物理世界的扩展。Agent-Computer Interface（ACI）的标准化[26]和安全对齐的方法论完善将是决定AI Agent能否从研究走向产业落地的关键因素。

参考文献

[1] Newell, A., & Simon, H. A. (1956). The logic theory machine. IRE Transactions on Information Theory, 2(3), 61-79.

[2] Fikes, R. E., & Nilsson, N. J. (1971). STRIPS. Artificial Intelligence, 2(3-4), 189-208.

[3] Laird, J. E., Newell, A., & Rosenbloom, P. S. (1987). SOAR. Artificial Intelligence, 33(1), 1-64.

[4] Brooks, R. A. (1986). A robust layered control system for a mobile robot. IEEE Journal on Robotics and Automation, 2(1), 14-23.

[7] Rao, A. S., & Georgeff, M. P. (1995). BDI agents. ICMAS, 312-319.

[8] Yao, S., et al. (2023). ReAct. ICLR 2023. arXiv: 2210.03629

[9] Wu, Q., et al. (2023). AutoGen. arXiv: 2308.08155

[10] Packer, C., et al. (2023). MemGPT. arXiv: 2310.08560

[11] Sumers, T. R., et al. (2024). Cognitive architectures for language agents. arXiv: [2309.02427](https://arxiv.org/abs/2309.02427

[12] Wang, L., et al. (2023). Plan-and-Solve. ACL 2023. arXiv: 2305.04091

[13] Yao, S., et al. (2023). Tree of Thoughts. NeurIPS 2023. arXiv: 2305.10601

[14] Silver, T., et al. (2024). LLM+P. ICRA 2024. arXiv: 2304.11477

[15] Shinn, N., et al. (2023). Reflexion. NeurIPS 2023. arXiv: 2303.11366

[16] Park, J. S., et al. (2023). Generative Agents. UIST 2023. arXiv: 2304.03442

[17] Schick, T., et al. (2023). Toolformer. NeurIPS 2023. arXiv: 2302.04761

[18] Patil, S. G., et al. (2023). Gorilla. arXiv: 2305.15334

[19] OpenAI. (2024). Introducing Operator. OpenAI Blog. operator.chatgpt.com

[20] Tao, M., et al. (2024). AgentVerse. ICLR 2024. arXiv: 2307.05483

[21] Wei, J., et al. (2022). Chain-of-Thought. NeurIPS 2022. arXiv: 2201.11903

[22] Brohan, A., et al. (2023). RT-2. arXiv: 2307.15818

[23] European Commission. (2024). EU AI Act. Official Journal of the EU.

[24] Bai, Y., et al. (2022). Constitutional AI. arXiv: 2212.08073

[25] Liu, X., et al. (2023). AgentBench. ICLR 2024. arXiv: 2308.03688

[26] Cognition Labs. (2024). Introducing Devin: The first AI software engineer. Cognition Blog. URL: https://www.cognition.ai/blog/introducing-devin

[27] Mialon G, et al. (2023). GAIA: A benchmark for general AI assistants. NeurIPS 2023 Datasets & Benchmarks. arXiv: 2311.12983

[28] Driess D, et al. (2023). PaLM-E: An embodied multimodal language model. ICML 2023. arXiv: 2303.03378

[29] Xi Z, Chen W, et al. (2023). The rise and potential of large language model based agents: A survey. arXiv: 2309.07864. URL: https://arxiv.org/abs/2309.07864

[30] Wang L, et al. (2024). A survey on large language model based autonomous agents. Frontiers of Computer Science, 18(6): 186901

AI Agent大语言模型人工智能多智能体

Back to Blog