随着代理开始拥有真正的权威,市场将需要一种明确的方法来衡量其可靠性。
撰文:Vaidik Mandloi
编译及整理:BitpushNews
AI 代理将改变互联网格局的承诺正逐渐成为现实。它们已超越聊天窗口中的实验性工具,成为我们日常运营中不可或缺的一部分——从清理收件箱、安排会议到回复支持工单,它们正在悄无声息地提升生产力,而这种改变往往被人们所忽视。
然而,这种增长并非只是传闻。
到 2025 年,自动流量已超越人类流量,占网络总活动的 51%。仅美国零售网站的 AI 驱动流量就同比增长了 4700%。AI 代理现在正跨系统运行,许多代理能够访问数据、触发工作流,甚至发起交易。
然而,对完全自主代理的信任度在一年内从 43% 降至 22%,这在很大程度上源于不断攀升的安全事件。近一半的企业仍在使用共享 API 密钥对代理进行身份验证,而这种方法从未设计用于让自主系统转移价值或独立行动。
问题在于:代理的扩展速度超过了旨在治理它们的基础设施。
作为回应,全新的协议层正在涌现。稳定币、卡网络集成以及像 x402 这样的代理原生标准,正在实现机器发起的交易。同时,新的身份和验证层也在开发中,以帮助代理在结构化环境中识别自身并进行操作。
但实现支付并不等同于实现经济。因为一旦代理可以转移价值,更根本的问题就会浮现:它们如何以机器可读的方式发现合适的服务?它们如何证明身份和授权?我们如何验证它们声称执行的操作确实发生了?
本文将探讨代理驱动经济大规模运行所需的基础设施,并评估这些层级是否足够成熟,以支持以机器速度运行的持久、自主参与者。
在代理为服务付费之前,它必须先找到该服务。这听起来很简单,但却是目前摩擦力最大的地方。
互联网是为人类阅读页面而构建的。当人类搜索内容时,搜索引擎返回排名链接。这些页面针对说服力进行了优化。它们充满了布局、追踪器、广告、导航栏和风格元素,这些对人有意义,但对机器来说主要是「噪音」。
当代理请求相同的页面时,它接收的是原始 HTML。一篇典型的博客文章或产品页面以这种形式可能需要大约 16,000 个 token。当转换为干净的 Markdown 文件时,token 计数会降至约 3,000 个。这意味着模型必须处理的内容减少了 80%。对于单次请求,这种差异可能无关紧要。但当代理跨多个服务发出数千次此类请求时,过多的处理会复合转化为延迟、成本和更高的推理复杂度。

@Cloudflare
代理最终花费了大量的计算精力来剥离界面元素,然后才能访问采取行动所需的核心信息。这种努力并没有提高输出质量,它只是在补偿一个从未为它们设计的网络。
随着代理驱动流量的增长,这种低效变得更加明显。零售和软件网站的 AI 驱动爬取在过去一年中大幅增加,目前已占网络总活动的大部分。
与此同时,约 79% 的主要新闻和内容网站至少屏蔽了一个 AI 爬虫。从它们的角度来看,这种反应是可以理解的。代理提取内容时不会与广告、订阅或传统的转化漏斗互动。屏蔽它们是为了保护收入。
问题在于,网络没有可靠的方法来区分恶意的抓取程序和合法的采购代理。 两者都表现为自动流量,都源自云基础设施。对系统而言,它们看起来一模一样。
更深层次的问题是,代理并不是在尝试「消费」页面,它们是在尝试发现行动的可能性。
当人类搜索「500 美元以下的机票」时,一个排名链接列表就足够了。人可以比较选项并做出决定。当代理收到相同的指令时,它需要完全不同的东西。它需要知道哪些服务接受预订请求、需要什么输入格式、价格如何计算以及支付是否可以程序化结算。极少有服务能清晰地公开这些信息。

@TowardsAI
这就是为什么对话正在从搜索引擎优化(SEO)转向代理导向的可发现性(Agent-Oriented Discoverability),通常被称为 AEO。如果最终用户是代理,那么在搜索页面上的排名就变得不那么重要了。重要的是服务是否能以代理无需猜测即可解读的方式描述其能力。如果不能,它就有可能在不断增长的经济活动份额中变得「隐形」。

@Hackernoon
一旦代理能够发现服务并发起交易,下一个主要问题就是让另一端的系统知道它在与谁打交道。换句话说:身份。
如今的金融系统运行的机器身份远多于人类身份。在金融领域,非人类身份与人类身份的比例约为 96 比 1。API、服务账户、自动化脚本和内部代理主导着机构基础设施。它们中的大多数从未被设计为对资本拥有裁量权。它们执行预定义的指令,不能谈判、选择供应商或在开放网络上发起支付。
自主代理改变了这一边界。如果一个代理可以直接移动稳定币或触发结账流程而无需手动确认,核心问题就从「它能支付吗?」转变为「谁授权它支付?」
这就是身份变得基础的地方,「了解你的代理」(Know Your Agent)的概念由此成型。
正如金融机构在允许客户交易前会进行核实一样,与自主代理互动的服务在授予资本访问权限或敏感操作之前,必须验证三件事:
这些检查共同构成了身份栈:
与此同时,由 Google 和 Shopify 领导的通用商务协议(UCP)允许商户发布代理可以发现并谈判的「能力清单」。它充当编排层,预计将集成到 Google 搜索和 Gemini 中。

@FintechBrainfood
重要的细微差别在于,无许可和许可系统将共存。
在公共区块链上,代理可以在没有中心化门槛的情况下进行交易。这提高了速度和可组合性,但也加剧了合规压力。Stripe 对 Bridge 的收购凸显了这种张力。稳定币实现了即时跨境转账,但合规义务并不会因为结算发生在链上而消失。
这种张力不可避免地将监管机构卷入其中。一旦自主代理能够在没有直接人工监督的情况下发起金融交易并与市场互动,问责制问题就变得不可回避。金融系统不能允许资本通过未识别或未授权的行为者流动,即使这些行为者是软件片段。
监管框架已经在被采纳。《科罗拉多州 AI 法案》于 2026 年 2 月 1 日生效,为高风险自动化系统引入了问责制要求,全球范围内类似的立法也在推进。随着代理开始大规模执行金融决策,身份将不再是可选的。如果说发现性让代理可见,那么身份就是让它们被认可的凭证。
一旦代理开始执行涉及金钱、合同或敏感信息的任务,仅仅拥有身份可能还不够。一个经过验证的代理仍然可能产生幻觉、歪曲其工作、泄露信息或表现不佳。
因此,最重要的问题是:能否证明代理确实完成了它所声称的工作?
如果一个代理声明它分析了 1,000 份文件、检测到了欺诈模式或执行了交易策略,必须有一种方法来验证这种计算确实发生了,并且输出没有被伪造或损坏。为此,我们需要一个性能层来实现这一点。
目前有三种方法可以实现:
这些机制从不同角度解决了同一个问题。然而,执行证明是偶发性的。它们验证单一任务,但市场需要累积性的东西。这就是声誉变得至关重要的地方。
声誉将孤立的证明转化为长期的性能历史。新兴系统旨在使代理性能具有便携性和加密锚定,而不是依赖于平台特定的评价或不透明的内部仪表板。
以太坊证明服务(EAS)允许用户或服务发布关于代理行为的已签名、链上证明。一次成功的任务完成、一次准确的预测或一笔合规交易都可以以防篡改的方式记录下来,并随代理跨应用移动。

@EAS
竞争性基准测试环境也在形成。代理竞技场(Agent Arenas)根据标准化任务评估代理,并使用 Elo 等评分系统进行排名。Recall Network 报告称,超过 11 万名参与者生成了 588 万份预测,创造了可衡量的性能数据。随着这些系统的扩展,它们开始类似于 AI 代理的真实评级市场。

这使得声誉可以跨平台携带。
在传统金融中,像穆迪(Moody『s)这样的机构对债券进行评级以发出信用信号。代理经济将需要一个等效层来对非人类行为者进行评级。市场需要评估一个代理是否足够可靠以委托资本,其输出是否具有统计一致性,以及其行为是否能长期保持稳定。
随着代理开始拥有真正的权威,市场将需要一种明确的方法来衡量其可靠性。代理将携带基于验证执行和基准测试的便携式性能记录,评分会随质量下降而调整,权限可追溯到明确的授权。保险商、商户和合规系统将依赖这些数据来决定哪些代理可以访问资本、数据或受监管的工作流。
总而言之,这些层级开始构成代理经济的基础设施:
【免责声明】市场有风险,投资需谨慎。本文不构成投资建议,用户应考虑本文中的任何意见、观点或结论是否符合其特定状况。据此投资,责任自负。
