BotOf Tech — 技术与植物养护笔记

6 月 5 日前后，AI 行业最值得看的不是某个模型 benchmark，而是算力合同。

媒体报道里出现了两个很强的信号：一是 Google 计划按月向 SpaceX 相关基础设施采购大规模计算资源；二是 Anthropic 早前也被报道以高额月费租用 Colossus 相关算力。这类消息容易被写成“谁赚了多少钱”，但真正值得开发者和创业者关注的是另一件事：

AI 公司的核心约束，正在从“有没有更强模型”扩展成“有没有稳定、可融资、可摊销的长期算力”。

这不是财经八卦，而是 AI 应用架构问题。因为底层算力合同最终会反映到 API 价格、限流策略、模型路由、企业版定价和 Agent 产品的任务成本里。

为什么算力合同会变成护城河

过去判断一家 AI 公司，大家主要看三件事：

现在必须再加三项：

前沿模型竞争已经进入重资产阶段。训练需要集群，推理需要持续供给，多模态和 Agent 又会放大调用次数。模型再强，如果没有稳定算力，产品节奏就会被排队、限流和成本卡住。

传统聊天产品的成本相对容易理解：用户问一次，模型答一次。Agent 产品不一样。一个看似简单的任务，可能包含几十次模型调用、浏览器操作、文件读取、代码执行、测试重试和最终总结。

如果每一步都默认调用最强模型，Agent 会很快变成成本黑洞。长期看，优秀的 Agent 系统不是“每次都用最贵模型”，而是能把任务拆成便宜、确定、可验证的步骤。

短期看，大额算力合同离普通应用开发者很远。长期看，它会影响三个层面。

第一，API 价格不会只由模型聪明程度决定，还会由底层算力租约、电力、机房、网络和折旧决定。即使模型能力提升，价格也未必线性下降。

第二，Agent 产品会更重视任务压缩、缓存、计划复用和工具调用效率。一个任务能不能少读 30% 上下文、少重试两次、少调用一次大模型，都会变成真实竞争力。

第三，本地模型、小模型和专用模型会重新变得有吸引力。不是所有任务都值得烧前沿算力：格式转换、规则校验、摘要预处理、代码静态分析、OCR 后处理，都可能交给更便宜的层。

这也是为什么 Skill 变重要。Skill 能把“不要每次都重新想”的流程固化下来，减少上下文浪费，也减少误操作。MCP 负责连接工具，Skill 负责把工具调用变成可控流程。

如果一个 AI 应用要长期成立，只看 demo 已经不够。更应该问这些问题：

如果这些问题答不清楚，再好的 demo 也可能在规模化时被成本拖住。

接下来 12 个月，Agent 产品的竞争会从“谁能回答得好”扩展成“谁能把一个任务拆得更便宜”。能省 token、少调用、复用上下文、用本地工具完成确定性步骤的系统，会比单纯堆大模型更有长期优势。

大额算力合同不是远处的资本新闻，它会一路传导到每个 AI 产品的架构设计。开发者应该从现在开始，把成本、限流、缓存、模型路由和工具调用审计当成一等工程问题。