观点文章

IBM专家团谈AI 智能体:在期待与现实之间
April 21, 2025

如今,只要稍微浏览一下科技媒体,就会不经意看到把 2025 年称为“AI...

如今,只要稍微浏览一下科技媒体,就会不经意看到把 2025 年称为“AI agent(AI智能体)之年”的文章,说智能体将改变我们工作的方式,影响我们的方方面面,无论是个人生活还是工作。

我们尚未完全从NFT 和加密货币山崩海啸式的炒作中探出头来,元宇宙的泡沫就随之而来,随着 OpenAI 的 GPT 模型系列、Anthropic 的 Claude 和微软的 Copilot 等产品的发布,媒体又开始对生成式AI(gen AI)大唱赞歌。

虽然这种高调的褒扬并没有完全停止,但是在 2025 年,媒体的焦点已经从大型语言模型(LLM) 转移到自动化的AI智能体上来了,说智能体正在带领我们步入工作的未来。

尽管围绕 Deepseek 的 R1(它承诺比 ChatGPT 有显著的性能提升)的兴趣一时激增,但 2025 年的主流创新叙事,依然是AI智能体。

媒体报道突出了智能体将带来的创新、自动化和效率,但其中有多少是吸引点击量的炒作?

广告支持的媒体世界靠吸引流量来发展壮大,因此,可以理解为什么会有耸人听闻的标题来吸引你的注意。那么,在 2025 年,我们能对智能体AI有什么切实的期望,它又将如何影响我们的生活呢?

我们与 IBM 的几位专家讨论了这个话题,以更理性的方式了解 AI 智能体和它们的作用。我们的专家包括:

什么是 AI智能体?

AI智能体是一个能够自主地理解、计划和执行任务的软件程序。AI智能体由大型语言模型驱动,可以根据需要与工具、其他模型以及系统或网络的其他方面进行交互,以实现用户的目标。

我们不再只是要求聊天机器人根据冰箱里的可用食材建议一份晚餐食谱。智能体的功能远远超出了发送一封自动化的客户体验电子邮件,这些电子邮件只会通知你需要几天时间才能有一个现实世界的人来处理你的询问。

AI智能体与传统的 AI 助手不同,后者每生成一个响应都需要一个提示。理论上讲,用户给智能体一个高级别的任务,智能体就会自己想办法完成这个任务。

目前的产品仍处于实现这一想法的早期阶段。“市场上通常所说的‘智能体’,实际上是将基本的计划和工具调用(有时称为函数调用)能力加入到 LLM 中”, Ashoori 说道。“这使LLM 可以将复杂任务分解成更小的步骤,这些步骤可以由 LLM 执行。”

Hay 乐观地认为,更强大的智能体正在开发中:“今天无需在模型上做进一步改进就能构建未来的 AI 智能体,”他说。 

2025年,围绕智能体有哪些重要的叙事(即如何被谈论),哪些是值得我们重视的呢?

叙事 12025 年是 AI智能体之年

《时代周刊》i预测,“更多更好的智能体 ”即将出现。路透社报道称,“自主‘智能体’和盈利能力很可能主导AI议程 ”ii。“智能体AI的时代已经来临”,《福布斯》在回应英伟达公司黄仁勋的说法时如是说iii

科技媒体充斥着这样的保证:我们的生活即将发生全面变革。自主智能体将简化和改变我们的工作,推动优化,陪伴我们的日常生活,实时处理我们的琐事,让我们腾出手来从事创造性和更高层次的工作。

2025 年:智能体的探索之年

“IBM 和 Morning Consult 对 1000 名开发人员进行了调查,这些开发人员正在为企业开发 AI 应用程序,其中 99% 的人表示他们正在探索或开发 AI智能体”, Ashoori 解释道。“是的,2025 年将是智能体之年。”不过,这种断言并非没有争议。

在描述了当前市场对智能体的看法,即将函数调用能力加入到 LLM之 后,Ashoori 指出真正的AI智能体的定义是“一个具有推理规划能力的智能实体,可以自主地采取行动”。这些推理和规划能力有待商议,取决于如何定义它们。

“我看到 AI智能体正朝这个方向发展,但尚未完全做到这点”, Gajjar 表示。“目前,我们已经看到了一些早期曙光——AI智能体已经可以分析数据、预测趋势和自动化工作流程,但要构建能够自主处理复杂决策的 AI智能体,仅有更好的算法是不够的,我们还需要在上下文推理和边缘情况测试方面取得重大飞跃,“她补充道。

Danilevsky 并不认为这是什么新鲜事,她说:"我依然很难确信这与单纯的编排有何不同。你只是将编排重新命为智能体,因为这是个很酷的词。但编排是我们在编程中一直在做的事情。“  

对于 2025 年将成为智能体之年的说法,Danilevsky 持怀疑态度。她说:“这取决于你所说的智能体是什么,你认为智能体将实现什么,以及智能体将带来什么样的价值。“在我们尚未弄清更普遍的 LLM 技术的投资回报率(ROI)时,就做出这样的声明是很不现实的。” 

她这么想不仅仅是商业层面的考虑。她说,“人们大肆宣传想象这个东西能替你思考,能在你的电脑上做出所有这些决定并采取行动。实际上,这太可怕了。”

Danilevsky将这种脱节描述为沟通不畅。“(智能体)往往非常无效,因为人类是非常糟糕的沟通者,人类还无法让聊天智能体在任何时候都能正确解释我们的意图。”

尽管如此,作为探索之年,2025年还是充满希望的。“我坚信 2025 年是智能体之年,”Hay 兴奋地说。

每个大型科技公司和成百上千的创业公司现在都在进行智能体的实验。例如Salesforce已经推出他们的 Agentforce 平台,该平台使用户能够创建容易集成到 Salesforce 应用生态系统中的智能体。

“浪潮即将来临,我们将拥有大量的智能体。这还是一个非常新生的生态系统,我认为很多人将构建智能体,并且会从中获得很多乐趣,“ Hay说道。

叙事 2:智能体可以自行处理高度复杂的任务

这一叙事假设今天的智能体符合本文引言中概述的理论定义,即2025 的智能体将是完全自主的 AI 程序,可以确定项目范围并使用他们需要的所有必要工具来完成项目,而无需人类合作伙伴介入。但是这一叙事缺乏细致入微的考虑。

今天的模型已经绰绰有余

Hay认为,构建智能体所需的基础设施已经铺设好。“AI智能体的一大优点是他们有能力进行规划,” Hay概括道。“他们有能力推理、使用工具和执行任务,而且他们需要快速、大规模地完成这些工作。”

他列举了2025年初的模型与 12 到 18 个月前最好模型相比所取得的四项改进,这意味着今天的模型可以为这一叙事所假设的智能体提供动力:

  1. 更好、更快、更小的模型
  2. 链式推理(COT)训练
  3. 增加上下文窗口
  4. 函数调用

“现在,这些事情中的大部分都在发挥作用,”Hay 继续说道。“你可以有 AI 调用工具;它可以规划;它可以推理并给出好的答案;它可以使用推理时间计算;它将具有更好的思路链和更多内存可供使用;它会很快地运行;它会很便宜。因此我认为你可以拥有智能体。模型还在改进,而且越来越好,所以这只会带来加速。“

期望值必须切合实际

Ashoori 谨慎地区分了智能体以后能做什么和现在能做什么。她说:“有的是承诺,有的是智能体现在能做的事情。我认为答案取决于用例。对于简单的用例,智能体能够(选择正确的工具),但对于比较复杂的用例,技术还有待成熟。” 

Danilevsky 将这一说法重新定义为基于情景的叙事。“如果某件事情在某一时刻是正确的,并不意味着它在所有时刻都是正确的。智能体可以做某些事情吗?当然可以,但这是否意味着你可以把任何突然出现在你脑海中的流程都智能体化?当然不是。” 

对于 Gajjar 来说,问题在于风险和管理。“我们看到,AI智能体正从内容生成器演变为自主解决问题的工具。这些系统必须在沙盘环境中进行严格的压力测试,以避免出现连锁故障。设计回滚行动机制并确保审计日志是使这些智能体在高风险行业中可行的不可或缺的一部分。” 

但她乐观地认为,我们会应对这些挑战。“我的确认为,今年我们将在创建回滚机制和审计追踪方面取得进展。这不仅关系到打造更智能的AI,还关系到设计安全网,以便我们能在事情偏离轨道时迅速追踪并解决问题。” 

虽然 Hay 对 2025 年的智能体发展潜力充满希望,但他也看到了另一个领域的问题: “大多数组织还没有做好智能体就绪的准备。有趣的是,企业目前拥有的应用程序接口(API)将被公开,这才是令人兴奋的工作,这与模型有多好无关,这将关系到企业就绪的程度。” 

叙事3AI编排器(AI orchestrators)将管理AI智能体网络

在叙事3所设想的 “新常态 ”中,AI智能体团队被集中在管理整个项目工作流程的编排器(orchestrators)超级模型之下。

企业将利用AI编排来协调多个智能体和其他机器学习(ML)模型协同工作,并利用特定的专业知识来完成任务。

合规性对健康的AI采用至关重要

Gajjar认为这一预测不仅可信,而且很有可能。“我们正处于这一转变的开端,它正在快速发展。”她认为:“AI编排器今年很可能成为企业级AI系统的支柱——连接多个智能体,优化AI工作流,处理多语种和多媒体数据。”不过,她提醒不要在没有适当保障措施的情况下草率行事。 

Gajjar 警告说:“与此同时,扩展这些系统将需要强大的合规框架,以便在不牺牲问责制的情况下保持平稳运行。2025年可能是我们从实验走向大规模应用的一年,我迫切想看到企业如何平衡速度与责任。”

企业必须以同样的热情致力于数据和AI的治理与合规。 

进步不是一条直线

“你将拥有一个AI编排器,它们将与多个智能体一起工作," Hay概述道。“较大的模型将充当编排器,而较小的模型将执行受约束的任务。”

不过,随着智能体的发展和改进,Hay预测,编排工作流程将会向单一智能体系统转变。“随着这些单个智能体的能力越来越强,你会转而说,我有这样一个智能体,它可以完成端到端的所有工作。” 

 Hay 预见到,随着模型的发展,会有一个来回演变的过程。“你会遇到[单个智能体所能做到的]极限,然后你会再次回到多智能体协作。你将在多智能体框架和单个神一样的智能体之间循环往复。” 虽然AI模型将决定项目工作流程,但 Hay 认为人类将始终处于环路之中。

编排并非总是正确的解决方案

对于 Ashoori 来说,对元编排器(meta-orchestrator)的需求并非完全必然,而是取决于预期的用例。她解释说:"这是一个架构决策。根据定义,每个智能体都应该有能力确定他们是否需要与另一个智能体协调,是否需要调用一系列工具,或者是否需要一些补充数据。你不一定非要一个中间智能体坐在上面监控每个智能体,告诉他们该做什么。” 

“但是,在某些情况下,你可能会这样做。”Ashoori 假设说:“你可能需要弄清楚如何结合使用专门的智能体来实现你的目标。在这种情况下,你可能会决定创建自己的智能体来充当编排器。” 

Danilevsky 建议企业首先了解哪些工作流程可以且应该进行智能体化,以获得何种程度的投资回报率,然后再据此制定AI战略。“是否会有一些带有某些智能体的编排流程?当然会有,但企业中的所有事情都应该用智能体流程来编排吗?不,这行不通。” 

叙事 4:智能体将增强人类员工的能力

未来一年对于智能体采用的一个普遍愿景是,智能体将增强而不一定是取代人类员工。倡导者说,智能体将为人类主导的工作流程简化做出贡献。

然而,在围绕企业AI采用的持续对话中,人们始终担心AI会导致失业。随着智能体能力的提高,企业领导会鼓励智能体与人类协作,还是寻求用AI工具取代员工?

AI应该是工具,而不是代替人

Ashoori 认为,最佳的前进道路在于信任员工,让他们决定在各自的工作中如何最有效地使用AI。她解释说:“我们应该授权员工决定如何使用智能体,而非在每种情况下都用AI来替代。”她解释说,“有些工作职能已经成熟,可以分流给智能体,而对于其他工作职能,AI是无法代替人的。智能体可能会誊写和总结会议内容,但你不会派智能体来和我进行这样的对话。”

Danilevsky 赞同 Ashoori 的观点,并指出在工作场所采用智能体不会没有成长的烦恼。“你会遇到这样的情况:一旦事情变得越来越复杂,就会需要人来处理。 虽然企业领导可能倾向于通过裁员来削减短期成本,但智能体将更多地沉淀为一种加持型的角色。”Danilevsky 在描述了她对AI的 “人机协同”(HITL)愿景时说。 

Hay 看到在工作中可持续采用 AI 的途径。“如果我们做得对,AI就能增强人类的能力,把事情做得更好。如果AI做得正确,它就能解放我们,让我们腾出时间去做更多有趣的事情。”但与此同时,他也能想象到另一个版本的未来,即AI被置于过高的优先级。“如果做得不好,做得不对,我们最终会让人类来增强AI,这确实存在风险。” 

Gajjar还告诫人们不要过于倚赖AI。“我不认为AI智能体能在一夜之间取代我们的工作,但它们肯定会重塑我们的工作方式。重复性、低价值的任务已经被自动化,这可以让人们腾出手来从事更具战略性和创造性的工作。尽管如此,企业在引入AI时仍需谨慎。治理框架(例如那些注重公平性、透明度和问责制的框架)将是关键所在。”

开源AI带来新机遇

对 Hay 来说,开源AI模式的一个好处是,它们为未来的AI智能体市场和构建者的后续盈利打开了大门。“我认为开源智能体是关键,”Hay 说。“因为开源,任何人都可以创建一个智能体,它可以完成有用的任务。你还可以创建自己的公司。” 

Hay认为,同样重要的是,要权衡潜在的成长之痛和组织结构调整与AI带来的好处,尤其是在南半球。LLM 提供基于文本的输出,在没有可靠互联网连接的地区,用户可以通过短信获得这些信息。Hay说:“由于AI可以在低带宽环境下工作,而且成本一直在降低,因此可以在[没有强大互联网接入]的国家实现这种功能,这非常令人兴奋。”

最后的思考: 治理和战略对成功实施AI智能体至关重要

在讨论当中,我们的四位专家都反复提到了两个主题。除了我们研究的四个叙事之外,要想在当前的AI爆炸中找到一条可持续发展的道路,企业和商业领袖必须接受两个理念: 

  1. AI治理是能够成功地合规和负责任使用这些新技术的基础。
  2. 以经济价值为重点的强大AI战略将引领企业可持续地采用AI

治理的必要性

Gajjar 敦促道:“随着这些智能体更深入地融入运营,公司需要治理框架来监控绩效并确保问责制。这正是 IBM 负责任的AI方法的真正优势所在,即确保AI与人合作,而不是与人作对,并且从第一天起就建立值得信赖和可审计的系统。” 

Ashoori 描绘了一幅潜在的AI智能体失误图。“现在使用智能体基本上就是抓住一个 LLM,让它代表你采取行动。如果这个行动是连接到一个数据集并删除一堆敏感记录,该怎么办?” 

“技术不会思考。它不可能负责任,"Danilevsky 说道。就意外数据泄漏或删除等风险而言,风险的规模更大。她说:“人类在有限的时间内只能做有限的事情,而技术可以在更短的时间内以我们可能不会注意到的方式做事。 ”

当这种情况发生时,我们不能简单地将矛头指向AI,而让负责人免责。Hay警告说:“该组织中要有人对这些行为负责。” 

“因此,这里的挑战就变成了透明度,"Ashoori 说。“智能体所做的每一件事都要有可追溯性。你需要清楚地知道发生了什么,并能够跟踪、追溯和控制。” 

Danilevsky 认为,自由实验是通往可持续发展的道路。“让人们真正玩转技术、构建技术并尝试突破技术,这有很大的价值。”她还敦促开发人员在决定使用哪些模型以及将哪些数据输入这些模型时要谨慎。“(有些供应商会)拿走你所有的数据。所以一定要小心谨慎。”

为什么AI战略很重要

“当技术变得更加常态化时,热潮就会平息下来,”Danilevsky 预测道。“我认为,人们将开始更好地理解哪些东西有用,哪些没用。” Gajjar补充说:“重点还应该是将AI智能体集成到生态系统中,使其能够不断学习和适应,从而推动长期效率的提高。” 

Danilevsky 很快就将期望落到实处,并将话题重新聚焦到可验证的业务需求上。“企业需要小心谨慎,不要成为寻找钉子的锤子,”她说。“当LLM刚刚出现时,我们就遇到过这种情况。人们说,第一步:我们要使用LLM。第二步: 我们应该用他们做什么?”

Hay 鼓励企业提前做好智能体就绪的准备。“有价值的将是那些利用自己的私有数据,并以一种能让智能体可以根据你的文件进行研究的方式来组织数据的组织。” 每家企业都拥有大量有价值的专有数据,将这些数据转化为智能体工作流的动力,将为企业带来积极的投资回报。 

Ashoori说:“有了智能体,企业就可以选择利用其专有数据和现有企业工作流程来实现差异化和规模化。 去年是企业进行实验和探索的一年,他们需要扩大这种影响,最大限度地提高生成式AI的投资回报率。智能体是实现这一目标的关键。” 

有关在企业中成功实施AI的更多信息,请阅读 Maryam Ashoori 撰写的智能体AI成本分析指南。此外,请收听 Vyoma Gajjar 和 Chris Hay 在 IBM 的Mixture of Experts 播客中对 2025 年AI的预测。

 


i  2025 年对人工智能的5个预测,Tharin Pillay 和 Harry Booth,《时代周刊》,2025 年 1 月 16 日。
ii 高管预测:2025 年,自主智能体和盈利能力将主导人工智能议程,Katie Paul,路透社,2024 年 12 月 13 日。
iii 2025: 智能体和物理AI--千亿美元经济崛起,蒂莫西-帕潘德里欧,《福布斯》,2025 年 1 月 15 日。

Article Categories