AI Agent（人工智能体）行业发展概述（附30页报告）

来源: | 购买报告：136-997-996-97微信 | 发布时间: 2025-11-19 | 114 3612次浏览 | 🔊 点击朗读正文 ❚❚ ▶ | 分享到:

本文为节选内容

如需更多报告，联系客服

或扫码获取报告

AI Agent（人工智能体）是能够感知环境、自主规划、进行决策和执行动作以实现目标的智能体，具有自主性、交互性、反应性、适应性等基本特征。与大模型和人类通过prompt进行交互的指令导向不同，AI Agent具备了通过独立思考、自主规划、调用工具去逐步完成给定目标的能力，为目标导向。

工作原理方面，根据《LLM Powered Autonomous Agents》（LilianWeng，2023），AI Agent核心驱动力为大语言模型，规划、记忆和工具使用是其三个关键的组件，即AI Agent=LLM（大语言模型）+Planning（规划）+Memory（记忆）+Tools（工具）。具体来看，AI Agent通过传感器感知周围环境，使用LLM进行记忆检索、决策推理和行动规划等，结合外部工具获取信息等，最终或使用具体执行器做出响应。

规划（Planning）：任务分解：调用LLM通过思维链能力将复杂任务分解为较小、可管理的子目标；反思和完善：通过对过去行为进行自我批评和反思，从错误行为中吸取教训并为未来的步骤进行改进，从而提高最终结果的质量。

记忆（Memory）：短期记忆：所有输入会形成短期记忆，以及上下文学习等都是利用模型的短期记忆来学习。短期记忆受到有限上下文窗口长度的限制；长期记忆：提供了长时间保留和调用信息的能力，外部向量数据库可通过快速检索进行访问。

工具使用（Tools）：外部工具API：通过使用外部工具API可获取大模型以外的信息和能力，如查询行程、设定闹钟等；插件功能：通过调用插件访问特定数据源等。

按交互对象不同，AI Agent 可分为自主智能体（Autonomous Agent）和生成智能体（GenerativeAgent）：自主智能体：交互对象只有人类，是在特定应用场景中根据人类通过自然语言提出的需求，依赖内在决策机制自动执行任务，从而实现预期结果的独立运行智能体，如AutoGPT、ChatGPT+插件等应用形式；生成智能体：交互对象包括人类和其他智能体，如斯坦福和Google 创建的西部世界小镇，其中25 个智能体在小镇上各自赋予了独特的个性和背景故事，有着组织结交、举办情人节、聊八卦等日常生活。

（1）学习范式：大模型赋能下，AI Agent 迁移学习能力快速提升

AI Agent 发展逾40 年，大模型赋能下跨入新的智能体阶段。20 世纪80 年代Wooldridge 等人将Agent引入人工智能，自此之后AI Agent 经历了符号智能体、反应型智能体、基于强化学习的智能体、具有迁移学习和元学习功能的智能体四大发展阶段。由于只能基于学习框架学到特定技能，未能理解从而泛化性较差，此前的AI Agent 只能用于特定领域。

符号智能体：主要通过逻辑规则和符号封装知识促进推理过程，应用在特定技术领域。如1980 年左右出现的模拟心理治疗、医学诊断专家系统等。

反应型智能体：为基于反应机制的智能体，能实时感知环境并作出快速响应，主要应用于机器人、游戏AI 等领域。如游戏中反应型智能体可通过学习玩家的操作习惯和战术，实时调整自己的游戏行为。基于强化学习的智能体：主要为通过智能体与环境的持续交互，利用最大化环境奖励来实现优化以期达到更高的智能水平，标志性的应用如围棋领域的AlphaGo。

基于迁移学习和元学习的智能体：主要为让智能体从少量样本中迅速推理出实现指令的最优策略。LLM 带来深度学习新范式，AI Agent 迁移学习能力快速提升。此前的强化学习等范式主要集中在增强特定领域的技术能力，但通用能力的发展被忽视，如长期规划、有效泛化、知识记忆等。随着OpenAI 陆续发布ChatGPT、GPT-4 推进以文本模型为主的大模型迭代，国内外科技巨头均在AI 大模型领域加快布局，LLM 快速发展但其仍存在的诸多不足如幻觉、上下文容量限制等使得基础大模型无法直接通向AGI。

而LLM具备的自然语言理解能力、思维链、涌现能力使得AI Agent具备了较好的学习和迁移能力，处理问题的泛化性效果增强，推动着AI Agent进入了新智能体阶段，成为通向AGI的主要探索路径。

（2）工作模式：从过程导向转为目标导向，自动化程度为关键转折点

生成式AI人机协同模式主要分为嵌入模式（Embedding）、副驾驶模式（Copilot）、智能体模式（Agent）三种：嵌入模式：用户使用文本或语音交流，通过Prompt输入使得生成式AI创作小说、音乐作品、代码等。在该模式下，生成式AI为执行指定命令的工具，人类承担着目标的规划和决策，完成绝大部分工作；副驾驶模式：AI介入到工作流程中，承担如为程序员编写代码、检测错误以及优化程序等辅助性工作。在该模式下，AI和人类协作工作，互相弥补短板、纠正错误；智能体模式：人类设定目标，生成式AI独立承担大部分工作，人类只负责监督进展及评估最后的成果。在该模式下，AI承担着绝大部分工作，具有独立思考和规划的能力。

基于LLM的AI Agent相较于嵌入模式、副驾驶模式，其工作模式更为高效，主要的差别在于LLM发展带来的“自主规划”能力。嵌入模式、副驾驶模式均需要人类指挥规划，而AI Agent具有自主记忆、推理、规划和执行的全自动能力，过程中不需要人的介入。

3、Agent—AI 的下一步，包括端侧Agent、应用侧AI Agent 两类载体

AIGC 赋能的第三类场景为AI Agent。Agent 为AI 应用的下一步，AI 由副驾驶逐步转向人类生产生活的独立助手，能够自主调用资源完成任务，人类在其中更多起到监督和评估的作用。AI Agent 目前有两类载体，一类为端侧Agent，基于手机、电脑等终端为用户服务，能自主调用终端中的功能与信息；另一类为软件层面的Agent，尤其看到在企业生产管理类软件中，基于企业目前积累的特有知识，实现任务自动化。Gartner 预测，到2028 年，至少15%的日常工作决策将通过人工智能代理自主完成（这一比例在2024 年尚为0%）。

（1）端侧AI Agent：终端为个人AI 助理优质载体

手机等终端设备承载大量个人专属信息，能够帮助AI Agent 实现个性化服务，同时AI 在端侧运行减少用户数据频繁上云，可兼顾AI 能力与数据隐私安全，终端侧为个人AI Agent 的良好载体。

目前，各大手机厂商均推出手机端AI。端侧AI 基于蒸馏剪枝后的轻量化模型在手机本地运行，同时端侧算力不够的情况下可连接到私有云上计算，确保用户数据安全和隐私。以Apple Intelligence 为例，AI 在端侧可实现自然语言理解，且实现基于个人背景的跨应用交互，AI 能够以个人信息为基础，从所有应用中检索和分析最相关的数据，以及读取屏幕内容，实现跨应用交互，打通终端信息，成为真正的个人助理。此外，基于生成式AI，用户在手机端还可实现图片生成与编辑，文本改写、校对与摘要，录音转写与摘要，邮件快速回复建议等。目前，Apple Intelligence 部分功能已于美国率先上线。除苹果外，小米、荣耀、三星、谷歌也先后推出手机端AI 功能。除手机外，智能眼镜、PC、机器人等端侧设备也为AI Agent 成熟载体。

智谱推出Agent 最新进展，探索LLM-OS 的可能性。智谱于2024 年11 月推出在Agent 探索上的最新进展。包括AutoGLM 可以自主执行超过50 步的长步骤操作，也可以跨app 执行任务，支持数十个网站的无人驾驶，以及像人一样操作电脑的GLM-PC 启动内测，基于视觉多模态模型实现通用Agent 技术探索。

更进一步，智谱CEO 张鹏将Agent 看作是大模型通用操作系统LLM-OS 的雏形，与智能设备结合后将为端侧智能化带来新的进展。

（3）应用侧AI Agent：企服应用为B端Agent优质载体

从海外进展来看，随着生成式AI和推理技术的快速发展，AI Agent在B端企业服务场景中的应用潜力正在加速释放。通过与企业积累的大量运营数据深度结合，AI Agent能够基于角色定位和目标导向，实现一定程度的自主操作，有效承担企业内重复性和低附加值的工作。这不仅帮助企业简化流程、提升效率，还通过减少人工投入和优化资源配置，显著降低运营成本，为企业提供了智能化转型的新路径。

Salesforce的Agentforce是一个典型的应用侧代理平台。它允许企业在Salesforce平台上构建和部署自主AI代理，这些代理能够自动执行各种业务功能，如销售、服务、营销和商务等。Agentforce的主要特点包括：

自主操作：代理可以独立分析数据、做出决策并完成任务，如解决客户问题、筛选销售线索和优化营销活动。

深度集成：作为Salesforce平台的一部分，Agentforce代理能够无缝访问和交互各种Salesforce应用中的数据，利用客户信息、触发工作流程和更新记录。

可定制性：用户可以使用低代码或无代码工具，快速构建和定制代理，以满足特定的业务需求。

安全性和信任：Agentforce通过Einstein Trust Layer，确保代理在使用任何大型语言模型时，Sales force数据不会被第三方模型提供商查看或保留。

Agentforce在Q3最后一周投入生产使用，仅在第三季度就有超过200笔Agentforce交易，且公司在Agentforce层面已看到巨大的潜在需求。Salesforce首席执行官MarcBenioff于近期宣布，公司计划招聘超过1000名员工，以强化Agentforce的推广。

北京时间2024年10月22日，微软重磅宣布在Dynamics365中集成了10个自主AI Agent。这10个AI Agent基于OpenAI的最新模型o1，具备自主学习能力，能够自动执行跨平台的超复杂业务，节省大量时间和运营成本。微软CEO、董事长Satya Nadella亲自宣布了这一AI新进展，并表示目前已有60%的财富500强企业正使用Microsoft365Copilot来加速业务成果并增强团队能力。

电话：13699799697（微信）

邮箱：cheyanzixun@163.com

地址：深圳市龙岗区龙岗街道银威路6号满京华喜悦里