当机器开始自主转账:x402能否真正颠覆传统支付体系?
作者:Paul Timofeev 来源:Shoal Research 翻译:善欧巴,金色财经
1849 年,成千上万的人奔赴加利福尼亚淘金。少数人一夜暴富,大多数人穷困而归。但最大的赢家,是那些制造镐头与铲子的商人,只要地下还有黄金,这些基础工具就永远重要。
如今的 “淘金热” 是人工智能。支付正在成为 AI 智能体工作流的基础组成部分,而承载这些支付的基础设施,无疑就是新时代的镐头与铲子。本文将深入解析 x402 协议,一种新兴的开源原生智能体支付基础设施,包括它是什么、如何运作、当前的采用现状,以及当机器开始自主流转资金时,x402 仍面临哪些悬而未决的问题。
一场结构性巨变正在发生
历史由结构性巨变定义:那些突然而深刻的变革,重塑了生活的根本基石。我们今天所处的地理格局,形成于约 1.75 亿年前地球板块漂移与分裂之时。时至今日,板块仍在缓慢移动,但现代世界最重大的剧变,来自人类的创新。
从苏美尔人的车轮、古腾堡印刷机到蒸汽机,基础性发明都形成了相似的正向飞轮:人类制造机器,机器创造经济盈余,盈余带来更多资金用于制造更好的机器,进而进一步放大产出。随着技术进步,试错成本下降,迭代速度加快。过去几十年间,在计算机及其衍生应用与服务的推动下,这一趋势尤为迅猛。

今天,这种变革性动力正通过软件,尤其是人工智能,全面落地。
人工智能早已存在。第一篇神经网络论文发表于 1943 年。80 年代的专家系统、90 年代的统计机器学习,已悄然将 AI 嵌入从信用评分到广告定向的各类生产流程。
21 世纪初起,垃圾邮件过滤、推荐引擎、欺诈检测便一直基于机器学习模型运行。真正的变化在于交互方式:生成式 AI 让人类可以通过自然语言自由与系统交互,这种易用性的跃迁,将 AI 推向了主流消费市场。
OpenAI 推出的 ChatGPT,以简洁直观的方式与底层 GPT 模型交互,5 天破百万用户,2 个月破亿用户,创下消费级互联网产品最快增长纪录。此后,Gemini、Claude、Grok 等竞品相继推出,激烈竞争推动各大实验室快速迭代模型与功能。
另一面,随着企业高管持续裁员、加大 AI 投入,关于岗位替代的担忧不断加剧(值得注意的是,如今美国超过半数的工作岗位在 1940 年并不存在)。
无人能确切断言 AI 将如何重塑社会。但截至 2025 年末,全球约每六人中就有一人使用过生成式 AI—— 一项三年前几乎不存在的技术。尽管仍处早期,一场结构性巨变已然全面展开。

但仅仅与 AI 对话,能做的事有限。只读权限,比如让大模型查阅信息、浓缩文本、编写代码、分析数据 —— 固然有用,但边界清晰。而在此基础上增加写入权限,即让 AI 在外部环境中真正执行操作,则解锁了完全不同的能力维度。
2025 年,OpenAI 推出 Operator 与 Codex,Anthropic 发布 Claude Code,Perplexity 上线 Comet,Google 将 Gemini 智能体深度嵌入 Workspace,微软则把 Copilot 全面融入 Office 与 Windows。Perplexity、Cursor、Sierra、Cognition 等公司纷纷完成数亿美元融资,营收创下历史新高。显而易见,智能体将定义人类与 AI 交互的下一篇章。
但一个被忽视的事实是:自主智能体多年来一直在驱动线上经济活动。数字广告市场,就是一个庞大的智能体经济,潜藏在几乎所有广告支持的网页背后(如今绝大多数大型消费网站与平台均属此类)。

每当用户加载一个网页,空白广告位就会进入微型拍卖流程;代表广告主(可以是任何线上商家)的智能体,会评估该广告位的价值并出价。出价最高者胜出,广告在数百毫秒内展示。页面加载完成时,广告已经就位。从规模来看,程序化数字广告年支出达数千亿美元,占当前展示广告预算的 90% 以上。
网络爬虫是另一个例子。这些自主智能体漫游互联网、追踪链接、抓取网页,将内容输入大规模索引与训练管线。类似地,数据抓取工具从网页提取原始信息,广泛应用于多个领域。更值得警惕的是,2025 年 “恶意机器人”—— 用于利用线上业务逻辑的程序 —— 占互联网流量的 37%。总体而言,超过一半的网络流量已由自主软件智能体产生。
然而,鲜有人知晓这些智能体的存在,真正使用它们的人更少。尽管这些智能体在特定功能上(如竞价广告位)十分高效,但其效用受限于专用属性:爬虫只会爬取,抓取器只会提取,竞价器只会出价,仅此而已。当这些不同能力被整合进单一程序、由单一界面控制时,应用的本质将彻底改变。这就是如今大众熟知的通用 AI 智能体。它们最根本的变革,是能在单一界面内执行多种任务、跨多个应用与环境运作。这些智能体旨在提升人类产出与效率:以更快速度完成更多事,随着普及度提升,它们将占据越来越大的网络流量份额。
那么,究竟什么是智能体?简单来说,是面向目标的软件程序:接收目标,识别实现目标所需步骤,在特定环境中利用可用工具采取行动,直至完成目标。
用户输入提示词,发送至智能体运行环境;智能体向模型输入提示,模型作为 “大脑” 做出决策;智能体调用可用工具(浏览器、API、数据库、日历等)执行任务,并循环吸收行动信息、推理、规划下一步动作,直至达到预设终止条件(如用户提示中指定的目标)。

Gartner 预测,到 2026 年末,约 40% 的企业应用将内置专用 AI 智能体。麦肯锡估计,到 2030 年,AI 智能体将撬动全球 3–5 万亿美元的消费市场规模。高盛预测,到 2030 年,智能体将成为知识工作的主要界面,侵蚀 SaaS 的大量潜在市场,同时扩大整个软件市场规模。

当然,这些只是预测而非事实,部分关于智能体短期影响的判断已被证明过于乐观。但忽视这场豪赌的规模,既困难又幼稚:即便 AI 智能体只实现预测增长的一小部分,它们也会成为消费者。而消费者首先需要一种方式,为想要购买的商品与服务支付费用。
机器需要流转资金
于是,资金的角色浮现。货币是一种协作工具:通用交换媒介与记账单位,让人类能与陌生人协作、高效完成交易结算。它支撑人类社会大规模合作,将个体努力汇聚为更大的生产整体。
随着 AI 智能体承担更多经济职能,它们也需要接入这一通用协作层。但智能体是结构完全不同的 “消费者”,行为模式与优化目标迥异。它们不受人类的认知或计算限制,其核心使命是成量级放大人类产出:更短时间完成更多工作,且往往以更频繁、更细粒度的资源消耗为代价。智能体也不会被广告对人类的情感诱导所影响。从设计上,它们是经济理性主体。
在这一背景下,货币的角色既熟悉又被功能化拓展:
-
作为交换媒介,最小化交易摩擦,实现智能体间无缝价值转移;
-
作为记账单位,提供标准化计量方式,让智能体进行精确的成本收益分析,判断任务算力成本是否匹配预期回报;
-
作为价值存储,让智能体保留购买力,跨时间、跨任务高效配置资本。
要实现这些功能,必须区分资产本身与流转资产的基础设施。货币是协作工具,而支付是其执行机制。从本质上讲,支付是清偿债务的方式:更新账本,证明价值已实际转移。对智能体而言,这是合约的功能化执行,是将决策转化为结果、解锁资源的关键步骤。没有结算能力,智能体实质上只能停留在 “只读” 状态。智能体需要一套专门的机制,为线上商品与服务支付。
但机器不是已经在转账了吗?
显而易见,这件事目前已经可以实现。AI 智能体已经可以接入每年流转数万亿美元的线上金融基础设施。这些系统围绕特定 checkout 流程构建:人类用户确认购买意图,生成交易支付令牌,商家通过自身支付服务商(PSP)完成处理。
以 OpenAI 与 Stripe 的 智能体商务协议(ACP) 为例。ACP 是一套开源 API 规范,通过标准化商家商品目录展示方式、智能体报价与购物车逻辑,以及用户确认意图后将支付信息委托回商家 PSP 的流程,让 AI 智能体可代用户完成购买。目前 ACP 最典型的落地,就是 ChatGPT 中的即时结账功能,由 Stripe 共享支付基础设施支持。用户通过自然语言提示,即可在熟悉的 ChatGPT 界面完成购物(买跑鞋、点外卖、预订餐厅等)。后端,ChatGPT 向商家 PSP 发送限定范围的支付令牌,商家完成扣款。

除 ACP 外,随着智能体商务体系逐步成型,智能体支付也在增长。Claude Code 与 Codex 通过用户账户预存余额执行工作流;OpenClaw 更进一步,支持为智能体发行带消费限额的虚拟卡;Google 的 UCP 与 AP2 使用绑定用户信用卡与邮箱的支付令牌。
这套体系可以运行,无需立刻重构。在人机协作结账场景中,该模式完全按设计发挥作用。
机器确实在转账,只是并非自主转账
但关键在于:这并非智能体支付的最终形态。当应用于大规模、持续性的智能体工作流时,该模式将不堪重负。
这个新兴生态被称为“虚拟智能体经济”:一系列互联的数字市场,AI 智能体在其中彼此交易,独立于人类劳动创造经济价值。至关重要的是,在这种经济中,智能体的交易与协作规模与速度远超人类直接监管范围。而这正是现有商务体系开始暴露核心经济与技术约束的地方。
ACP 等协议沿用传统支付机制:信用卡、数字钱包、先买后付服务。使用这些协议的消费者与商家,仍要承担其成本结构:每笔交易 2.9% + 0.3 美元,多日结算,120 天拒付期。对人类而言麻烦但尚可接受。
但智能体的交易规模要大得多。智能体系统通常会将复杂问题拆解为价值仅零点零几美分的细粒度分布式任务。数千步操作叠加后,现有成本结构将彻底崩溃:试想一笔价值 0.02 美元的微任务,固定费用 0.3 美元,溢价高达 1500%。
归根结底,这源于更深层的架构问题。正如 Felipe Montealegre 在《Internet Finance》中所述,现代金融系统只是一堆私有服务器的集合。价值转移需要授权管理员在服务器间对账,这一过程体现为结算延迟与分层手续费。当 AI 智能体通过 ACP 等协议发起购买时,会触发同步链路:请求转发至 Stripe,再到发卡行。Stripe 收取手续费,Visa、万事达收取手续费,银行收取手续费,各方独立运作。
这种对账机制的效率,为整个经济设定了速度上限。2024 年国际清算银行报告显示,数字支付普及率每提升 1 个百分点,两年内人均 GDP 增速提升 0.10 个百分点。如果消除人类支付摩擦能带来如此效果,对速度高出数个量级的智能体而言,影响将更为巨大。
还有一个更隐蔽的成本:权限本身。传统支付基础设施围绕离散、大额的人类间交易设计(至少数美元级别)。建立在其上的合规体系,例如KYC、反洗钱检查、拒付系统、代理银行 —— 都是对该规模下法律责任的理性应对。一次 0.004 美元的 API 调用,风险与 5 万美元电汇截然不同,但现有基础设施对二者施加相似的 overhead。
Nick Szabo 在 1999 年提出过一个相关问题:心理交易成本,即为小额支付决策所付出的认知负担。早期微支付商业失败,并非技术无法处理小额支付,而是人类必须为每一笔小额支付主动授权。大规模来看,注意力比金钱更昂贵。
智能体系统看似解决了这一问题:Claude Code 从预充值账户扣款,无需打断用户。但这只是带预算的代理模式,并非自主经济主体。智能体的经济范围由人类操作者在设置时固定,无法协商获取新资源、获取预配置之外的能力,也不具备会话之外的经济身份。Szabo 提出的问题,以智能体能力上限的形式重新出现。
智能体在传统支付轨道上遇到的另一关键约束是身份。在现有人机结账流程中,智能体本质上借用用户身份进行交易。整个体系默认付款方是拥有合法身份、银行关系与个人责任的自然人,而智能体(至少目前)不具备这些。Claude Code 支付时,使用的是用户的 Stripe 凭证、商家的欺诈模型、卡组织的拒付规则、银行的结算框架。一个每笔交易都锚定人类合法身份的智能体经济,算不上真正的智能体经济。
这也带来了未解决的法律问题:智能体如何执行反洗钱检查?如何提交可疑活动报告?如何筛查制裁违规?这些问题正逐渐获得联邦层面关注,答案或将很快出现。美国国家标准与技术研究院(NIST)下属国家网络安全卓越中心,刚发布一篇关于 AI 智能体身份与授权的概念文件,将其列为需要全新开源未来标准的未解决基础设施问题。
人机结账流程确实有用。但在其下一阶段 ——AI 智能体经济体中,成本、自主性、身份是现有系统无法调和的三大约束。多日结算与缺乏 7×24 小时全球支付轨道进一步增加摩擦,尽管这些次于上述结构性问题。解决这些约束,首先要理解 AI 智能体的实际运作方式。智能体是软件,运行在网络上,因此最自然的支付层,或许就蕴藏在网络本身之中。
免责声明:
1.资讯内容不构成投资建议,投资者应独立决策并自行承担风险
2.本文版权归属原作所有,仅代表作者本人观点,不代币币情的观点或立场
首页
快讯