信任下滑！Salesforce因大模型 “幻觉”问题，已缩减使用

信任下滑！Salesforce因大模型 “幻觉”问题，已缩减使用 | T Insights

2025-12-31 17:10

创新观察局

关注

大模型多重缺陷暴露。

过去一年，Salesforce首席执行官马克·贝尼奥夫（Marc Benioff）一直大力推广公司的核心AI产品Agentforce，宣称它能帮企业借助大型语言模型（LLM）实现工作自动化，从而节省开支。

然而最近，Salesforce高管却向客户传递了截然不同的信息：Agentforce在不那么依赖LLM（即生成式AI技术）时，有时表现会更好。

产品营销高级副总裁Sanjna Parulekar表示，Salesforce已在Agentforce中采用了基础的“确定性”自动化形式，以提升软件的可靠性。这意味着它会根据预设指令做出决策，而非像AI模型那样依赖推理和解读。

从力捧到克制，LLM暴露多重痛点

“一年前，我们大家对LLM的信任度都更高，”她说。

该公司官网目前写道，Agentforce能够帮助消除LLM固有的随机性，确保关键业务流程每次都严格遵循相同步骤。

尽管这一调整避免了聊天机器人等AI产品出现行为失控的情况，但也导致它们有时无法理解客户问题背后的语境与深层诉求，或像ChatGPT那样对复杂问题给出全面答案。

作为最具价值的软件公司之一，Salesforce对LLM的部分回调可能会影响数千家使用该技术的企业。

源自OpenAI、Anthropic等AI提供商的LLM，能实现多场景自动化 —— 覆盖软件工程、数据分析、金融，再到营销、销售、客户服务等领域。

虽然许多大型企业已发现LLM的实用价值，但要将其转化为能处理多步骤任务的可靠AI代理，它们仍面临诸多技术、财务和组织层面的挑战。

大型语言模型（LLM）的工作机制与现存缺陷（图片来源：YouTube@AndrejKarpathy)

一些企业发现，很难阻止LLM在回答中出现不当行为或做出错误猜测。

这对于需要精准处理的任务来说是个大问题，比如库存跟踪或客户退款申请处理，否则可能导致糟糕的商业决策，引发员工或客户不满。

Salesforce在AI营销方式上经历了重大转变——贝尼奥夫曾称该产品的部署易如反掌。

例如，今年部分Agentforce客户遭遇了被称为“幻觉”的技术故障，不过公司表示产品正在快速优化完善。

作为少数披露AI专项收入的大公司之一，Salesforce称Agentforce目前的年度收入有望突破5亿美元。

确定性触发机制

许多客户需要AI提供商提供大量指导才能让技术正常运行，部分客户还对其运行成本颇有怨言。

Agentforce代理每处理一次对话收费2美元，此外公司还推出了预购积分、按实际使用量结算的付费方案。

Agentforce首席技术官Muralidhar Krishnaprasad表示，采用更基础的自动化形式（比如为计算机编写确定性指令，俗称“如果A则B”的逻辑语句），降低了Agentforce的运营成本，也降低了客户使用成本。

Agentforce的使用界面（图片来源：Salesforce官网）

“如果给LLM下达超过8条左右的指令，它就可能开始遗漏指令，这可不是什么好事，”他说。

“有些环节需要绝对的确定性，我们没必要为此浪费令牌……这不仅能节省LLM的使用成本，更重要的是能确保用户得到准确答案。”

家庭安防公司Vivint的工程高级副总裁瑞安·吉表示，该公司此前尝试自行开发AI聊天机器人未果，于去年开始使用Agentforce为250万客户提供客服支持。

Vivint在使用Agentforce初期遇到了一些问题，产品并非100%可靠。

例如，Vivint曾要求Agentforce在每次客户互动结束后发送满意度调查，但有时AI会无故不发送调查，具体原因始终不明。

他说，Vivint与Salesforce合作，在Agentforce中设置了“确定性触发机制”，确保每次都能发出调查。

Salesforce另一高管菲尔·梅在10月的一篇博客中表示，公司已开发出Agentforce Script系统，通过识别哪些任务或任务环节可由不使用LLM的“代理”处理，来最大限度降低LLM的“不可预测性”。

Agentforce Script关键功能（图片来源：YouTube@SalesforceDevs)

梅指出，Salesforce最资深客户正受AI“偏移”问题困扰——当用户提出无关问题时，代理会偏离预设目标。

比如，原本用于引导客户填写表单的AI聊天机器人，在客户询问与表单无关的问题时就会“分心”。

目前，Agentforce Script仍处于测试阶段。

LLM缩减背后，是优化还是妥协？

Salesforce在营销Agentforce时，着重强调了该产品如何改变了公司自身的运营。

例如，贝尼奥夫曾表示，部分依赖OpenAI LLM的Agentforce如今已承接了Salesforce的大部分客户服务咨询，帮助公司裁减了约4000名客服岗位。

然而，近几个月来，Salesforce似乎减少了其Agentforce驱动的客服代理对LLM的使用。

比如上周，该公司在回应一项关于Agentforce技术问题的求助时，仅提供了一系列博客文章链接，而非询问更多信息或就可能的问题进行沟通。

且列表中的第一个博客链接涉及今年6月影响Agentforce及其他多款Salesforce产品的一次宕机事件，对当前遇到问题的客户来说几乎没有参考价值。

这样的回应与多年来企业使用基础聊天机器人处理客户或网站访客咨询的方式颇为相似。

Salesforce发言人否认了公司为客服代理缩减LLM使用的说法。

他表示，针对客服代理，公司今年“优化了主题结构，加强了安全防护机制，提升了信息检索质量，并优化了回应逻辑，使其更具体、更贴合语境、更符合客户实际需求。

我们现在还拥有了更完善的可观测性和反馈循环，能快速发现代理回应过于宽泛、偏离主题或表述不清的地方，并迅速迭代改进。

因此，从提供通用答案到给出结构化、针对性回应的转变，完全是有意为之，也是优化代理的必要过程。”

该发言人补充道，客服代理“解决的客户问题比以往任何时候都多”，预计在1月底结束的财年中，已解决的对话数量将增长90%。

“我们在客服场景中使用LLM的方式和场景上变得更加审慎，”他说。

对于其他AI提供商而言，LLM也被证明难以驾驭，它们常常偏离预设用途。例如，本月早些时候，由企业AI初创公司Sierra提供技术支持的盖璞（Gap Inc.）聊天机器人，竟回答了有关情趣用品等敏感问题。

Sierra表示，已修复盖璞聊天机器人的配置漏洞，并指出有“恶意分子”蓄意滥用该聊天机器人。

编辑：杨鹭婕

参考来源：The Information

END

原文标题 : 信任下滑！Salesforce因大模型 “幻觉”问题，已缩减使用 | T Insights

本地收藏打印推荐给朋友

声明： 本文由入驻维科号的作者撰写，观点仅代表作者本人，不代表OFweek立场。如有侵权或其他问题，请联系举报。

发表评论

共0条评论，0人参与

立即登录即可访问所有OFweek服务

忘记密码

其他方式

请输入评论内容...

请输入评论/评论长度6~500个字

暂无评论

图片新闻