
AI 算力正在变成新的云合同,而不只是芯片采购
6 月 5 日前后,AI 行业最值得看的不是某个模型 benchmark,而是算力合同。
媒体报道里出现了两个很强的信号:一是 Google 计划按月向 SpaceX 相关基础设施采购大规模计算资源;二是 Anthropic 早前也被报道以高额月费租用 Colossus 相关算力。这类消息容易被写成“谁赚了多少钱”,但真正值得开发者和创业者关注的是另一件事:
AI 公司的核心约束,正在从“有没有更强模型”扩展成“有没有稳定、可融资、可摊销的长期算力”。
这不是财经八卦,而是 AI 应用架构问题。因为底层算力合同最终会反映到 API 价格、限流策略、模型路由、企业版定价和 Agent 产品的任务成本里。
为什么算力合同会变成护城河
过去判断一家 AI 公司,大家主要看三件事:
- 模型能力;
- API 价格;
- 用户增长。
现在必须再加三项:
- 算力是否稳定可用;
- 单位推理成本能不能持续下降;
- 长期租约会不会锁死现金流。
前沿模型竞争已经进入重资产阶段。训练需要集群,推理需要持续供给,多模态和 Agent 又会放大调用次数。模型再强,如果没有稳定算力,产品节奏就会被排队、限流和成本卡住。
| 竞争维度 | 过去的关键问题 | 现在新增的问题 |
|---|---|---|
| 模型能力 | 参数、架构、benchmark | 能否稳定服务高并发真实任务 |
| 产品体验 | 回答质量、响应速度 | 多步 Agent 任务的总延迟和失败率 |
| 商业化 | API 单价、订阅收入 | 长期算力租约能否被收入覆盖 |
| 融资叙事 | 增长速度、用户规模 | 基础设施投入是否可解释、可摊销 |
| 开发者生态 | SDK、文档、模型选择 | 限流、成本可预测性、企业 SLA |
Agent 让成本问题更突出
传统聊天产品的成本相对容易理解:用户问一次,模型答一次。Agent 产品不一样。一个看似简单的任务,可能包含几十次模型调用、浏览器操作、文件读取、代码执行、测试重试和最终总结。
| 任务步骤 | 成本来源 | 优化空间 |
|---|---|---|
| 理解目标 | 大模型推理、上下文读取 | 用模板化 Skill 限定输入 |
| 查资料 | 搜索、文档检索、网页读取 | 优先官方文档和缓存结果 |
| 写代码 | 模型生成、文件 diff | 复用局部上下文,少做全仓扫描 |
| 跑测试 | 计算资源、失败重试 | 先跑小测试,再扩大范围 |
| 调工具 | MCP 调用、外部 API | 给工具调用设置明确前置条件 |
| 总结交付 | 模型整理、引用来源 | 保留结构化日志,减少重复解释 |
如果每一步都默认调用最强模型,Agent 会很快变成成本黑洞。长期看,优秀的 Agent 系统不是“每次都用最贵模型”,而是能把任务拆成便宜、确定、可验证的步骤。
对开发者的直接影响
短期看,大额算力合同离普通应用开发者很远。长期看,它会影响三个层面。
第一,API 价格不会只由模型聪明程度决定,还会由底层算力租约、电力、机房、网络和折旧决定。即使模型能力提升,价格也未必线性下降。
第二,Agent 产品会更重视任务压缩、缓存、计划复用和工具调用效率。一个任务能不能少读 30% 上下文、少重试两次、少调用一次大模型,都会变成真实竞争力。
第三,本地模型、小模型和专用模型会重新变得有吸引力。不是所有任务都值得烧前沿算力:格式转换、规则校验、摘要预处理、代码静态分析、OCR 后处理,都可能交给更便宜的层。
应用架构要开始按成本设计
| 设计动作 | 目的 | 示例 |
|---|---|---|
| 任务分层 | 把“必须大模型推理”和“确定性执行”分开 | 规划用大模型,格式校验用脚本 |
| 上下文缓存 | 减少重复读取和重复解释 | 文档摘要、仓库索引、历史决策记录 |
| 模型路由 | 不同任务使用不同模型 | 高风险推理用强模型,简单分类用小模型 |
| 工具优先 | 能调用真实工具就不要让模型猜 | 查询数据库、读取文件、跑测试 |
| 失败预算 | 限制无限重试 | 每个任务最多重试 N 次,失败后输出原因 |
| 成本日志 | 让团队知道钱花在哪里 | 记录调用次数、token、工具时长、失败率 |
这也是为什么 Skill 变重要。Skill 能把“不要每次都重新想”的流程固化下来,减少上下文浪费,也减少误操作。MCP 负责连接工具,Skill 负责把工具调用变成可控流程。
对创业者的判断指标
如果一个 AI 应用要长期成立,只看 demo 已经不够。更应该问这些问题:
- 一个完整任务的平均成本是多少?
- 用户愿意为这个完整任务付多少钱?
- 失败重试会不会把毛利吃掉?
- 是否依赖单一模型或单一云供应?
- 哪些步骤可以转成脚本、缓存、小模型或本地工具?
- 企业客户是否需要成本上限和调用审计?
如果这些问题答不清楚,再好的 demo 也可能在规模化时被成本拖住。
我的判断
接下来 12 个月,Agent 产品的竞争会从“谁能回答得好”扩展成“谁能把一个任务拆得更便宜”。能省 token、少调用、复用上下文、用本地工具完成确定性步骤的系统,会比单纯堆大模型更有长期优势。
大额算力合同不是远处的资本新闻,它会一路传导到每个 AI 产品的架构设计。开发者应该从现在开始,把成本、限流、缓存、模型路由和工具调用审计当成一等工程问题。
来源
- TechCrunch:Google will pay SpaceX $920M per month for compute
https://techcrunch.com/2026/06/05/google-will-pay-spacex-920m-per-month-for-compute/ - Axios:Anthropic is paying SpaceX $1.25 billion a month
https://www.axios.com/2026/05/20/anthropic-spacex-compute