AI Agent(人工智能体)行业发展概述(附30页报告)
来源: | 购买报告:136-997-996-97微信 | 发布时间: 2025-11-19 | 94 3612次浏览 | 🔊 点击朗读正文 ❚❚ | 分享到:

本文为节选内容

如需更多报告,联系客服

或扫码获取报告




AI Agent(人工智能体)是能够感知环境、自主规划、进行决策和执行动作以实现目标的智能体,具有自主性、交互性、反应性、适应性等基本特征。与大模型和人类通过prompt进行交互的指令导向不同,AI Agent具备了通过独立思考、自主规划、调用工具去逐步完成给定目标的能力,为目标导向。

工作原理方面,根据《LLM Powered Autonomous Agents》(LilianWeng,2023),AI Agent核心驱动力为大语言模型,规划、记忆和工具使用是其三个关键的组件,即AI Agent=LLM(大语言模型)+Planning(规划)+Memory(记忆)+Tools(工具)。具体来看,AI Agent通过传感器感知周围环境,使用LLM进行记忆检索、决策推理和行动规划等,结合外部工具获取信息等,最终或使用具体执行器做出响应。

规划(Planning):任务分解:调用LLM通过思维链能力将复杂任务分解为较小、可管理的子目标;反思和完善:通过对过去行为进行自我批评和反思,从错误行为中吸取教训并为未来的步骤进行改进,从而提高最终结果的质量。

记忆(Memory):短期记忆:所有输入会形成短期记忆,以及上下文学习等都是利用模型的短期记忆来学习。短期记忆受到有限上下文窗口长度的限制;长期记忆:提供了长时间保留和调用信息的能力,外部向量数据库可通过快速检索进行访问。

工具使用(Tools):外部工具API:通过使用外部工具API可获取大模型以外的信息和能力,如查询行程、设定闹钟等;插件功能:通过调用插件访问特定数据源等。

按交互对象不同,AI Agent 可分为自主智能体(Autonomous Agent)和生成智能体(GenerativeAgent):自主智能体:交互对象只有人类,是在特定应用场景中根据人类通过自然语言提出的需求,依赖内在决策机制自动执行任务,从而实现预期结果的独立运行智能体,如AutoGPT、ChatGPT+插件等应用形式;生成智能体:交互对象包括人类和其他智能体,如斯坦福和Google 创建的西部世界小镇,其中25 个智能体在小镇上各自赋予了独特的个性和背景故事,有着组织结交、举办情人节、聊八卦等日常生活。

(1)学习范式:大模型赋能下,AI Agent 迁移学习能力快速提升

AI Agent 发展逾40 年,大模型赋能下跨入新的智能体阶段。20 世纪80 年代Wooldridge 等人将Agent引入人工智能,自此之后AI Agent 经历了符号智能体、反应型智能体、基于强化学习的智能体、具有迁移学习和元学习功能的智能体四大发展阶段。由于只能基于学习框架学到特定技能,未能理解从而泛化性较差,此前的AI Agent 只能用于特定领域。

符号智能体:主要通过逻辑规则和符号封装知识促进推理过程,应用在特定技术领域。如1980 年左右出现的模拟心理治疗、医学诊断专家系统等。

反应型智能体:为基于反应机制的智能体,能实时感知环境并作出快速响应,主要应用于机器人、游戏AI 等领域。如游戏中反应型智能体可通过学习玩家的操作习惯和战术,实时调整自己的游戏行为。基于强化学习的智能体:主要为通过智能体与环境的持续交互,利用最大化环境奖励来实现优化以期达到更高的智能水平,标志性的应用如围棋领域的AlphaGo。

基于迁移学习和元学习的智能体:主要为让智能体从少量样本中迅速推理出实现指令的最优策略。LLM 带来深度学习新范式,AI Agent 迁移学习能力快速提升。此前的强化学习等范式主要集中在增强特定领域的技术能力,但通用能力的发展被忽视,如长期规划、有效泛化、知识记忆等。随着OpenAI 陆续发布ChatGPT、GPT-4 推进以文本模型为主的大模型迭代,国内外科技巨头均在AI 大模型领域加快布局,LLM 快速发展但其仍存在的诸多不足如幻觉、上下文容量限制等使得基础大模型无法直接通向AGI。

而LLM具备的自然语言理解能力、思维链、涌现能力使得AI Agent具备了较好的学习和迁移能力,处理问题的泛化性效果增强,推动着AI Agent进入了新智能体阶段,成为通向AGI的主要探索路径。

(2)工作模式:从过程导向转为目标导向,自动化程度为关键转折点

生成式AI人机协同模式主要分为嵌入模式(Embedding)、副驾驶模式(Copilot)、智能体模式(Agent)三种:嵌入模式:用户使用文本或语音交流,通过Prompt输入使得生成式AI创作小说、音乐作品、代码等。在该模式下,生成式AI为执行指定命令的工具,人类承担着目标的规划和决策,完成绝大部分工作;副驾驶模式:AI介入到工作流程中,承担如为程序员编写代码、检测错误以及优化程序等辅助性工作。在该模式下,AI和人类协作工作,互相弥补短板、纠正错误;智能体模式:人类设定目标,生成式AI独立承担大部分工作,人类只负责监督进展及评估最后的成果。在该模式下,AI承担着绝大部分工作,具有独立思考和规划的能力。

基于LLM的AI Agent相较于嵌入模式、副驾驶模式,其工作模式更为高效,主要的差别在于LLM发展带来的“自主规划”能力。嵌入模式、副驾驶模式均需要人类指挥规划,而AI Agent具有自主记忆、推理、规划和执行的全自动能力,过程中不需要人的介入。

3、Agent—AI 的下一步,包括端侧Agent、应用侧AI Agent 两类载体

AIGC 赋能的第三类场景为AI Agent。Agent 为AI 应用的下一步,AI 由副驾驶逐步转向人类生产生活的独立助手,能够自主调用资源完成任务,人类在其中更多起到监督和评估的作用。AI Agent 目前有两类载体,一类为端侧Agent,基于手机、电脑等终端为用户服务,能自主调用终端中的功能与信息;另一类为软件层面的Agent,尤其看到在企业生产管理类软件中,基于企业目前积累的特有知识,实现任务自动化。Gartner 预测,到2028 年,至少15%的日常工作决策将通过人工智能代理自主完成(这一比例在2024 年尚为0%)。

(1)端侧AI Agent:终端为个人AI 助理优质载体

手机等终端设备承载大量个人专属信息,能够帮助AI Agent 实现个性化服务,同时AI 在端侧运行减少用户数据频繁上云,可兼顾AI 能力与数据隐私安全,终端侧为个人AI Agent 的良好载体。

目前,各大手机厂商均推出手机端AI。端侧AI 基于蒸馏剪枝后的轻量化模型在手机本地运行,同时端侧算力不够的情况下可连接到私有云上计算,确保用户数据安全和隐私。以Apple Intelligence 为例,AI 在端侧可实现自然语言理解,且实现基于个人背景的跨应用交互,AI 能够以个人信息为基础,从所有应用中检索和分析最相关的数据,以及读取屏幕内容,实现跨应用交互,打通终端信息,成为真正的个人助理。此外,基于生成式AI,用户在手机端还可实现图片生成与编辑,文本改写、校对与摘要,录音转写与摘要,邮件快速回复建议等。目前,Apple Intelligence 部分功能已于美国率先上线。除苹果外,小米、荣耀、三星、谷歌也先后推出手机端AI 功能。除手机外,智能眼镜、PC、机器人等端侧设备也为AI Agent 成熟载体。

智谱推出Agent 最新进展,探索LLM-OS 的可能性。智谱于2024 年11 月推出在Agent 探索上的最新进展。包括AutoGLM 可以自主执行超过50 步的长步骤操作,也可以跨app 执行任务,支持数十个网站的无人驾驶,以及像人一样操作电脑的GLM-PC 启动内测,基于视觉多模态模型实现通用Agent 技术探索。

更进一步,智谱CEO 张鹏将Agent 看作是大模型通用操作系统LLM-OS 的雏形,与智能设备结合后将为端侧智能化带来新的进展。

(3)应用侧AI Agent:企服应用为B端Agent优质载体

从海外进展来看,随着生成式AI和推理技术的快速发展,AI Agent在B端企业服务场景中的应用潜力正在加速释放。通过与企业积累的大量运营数据深度结合,AI Agent能够基于角色定位和目标导向,实现一定程度的自主操作,有效承担企业内重复性和低附加值的工作。这不仅帮助企业简化流程、提升效率,还通过减少人工投入和优化资源配置,显著降低运营成本,为企业提供了智能化转型的新路径。

Salesforce的Agentforce是一个典型的应用侧代理平台。它允许企业在Salesforce平台上构建和部署自主AI代理,这些代理能够自动执行各种业务功能,如销售、服务、营销和商务等。Agentforce的主要特点包括:

自主操作:代理可以独立分析数据、做出决策并完成任务,如解决客户问题、筛选销售线索和优化营销活动。

深度集成:作为Salesforce平台的一部分,Agentforce代理能够无缝访问和交互各种Salesforce应用中的数据,利用客户信息、触发工作流程和更新记录。

可定制性:用户可以使用低代码或无代码工具,快速构建和定制代理,以满足特定的业务需求。

安全性和信任:Agentforce通过Einstein Trust Layer,确保代理在使用任何大型语言模型时,Sales force数据不会被第三方模型提供商查看或保留。

Agentforce在Q3最后一周投入生产使用,仅在第三季度就有超过200笔Agentforce交易,且公司在Agentforce层面已看到巨大的潜在需求。Salesforce首席执行官MarcBenioff于近期宣布,公司计划招聘超过1000名员工,以强化Agentforce的推广。

北京时间2024年10月22日,微软重磅宣布在Dynamics365中集成了10个自主AI Agent。这10个AI Agent基于OpenAI的最新模型o1,具备自主学习能力,能够自动执行跨平台的超复杂业务,节省大量时间和运营成本。微软CEO、董事长Satya Nadella亲自宣布了这一AI新进展,并表示目前已有60%的财富500强企业正使用Microsoft365Copilot来加速业务成果并增强团队能力。