懒人包:Google 每个月向 SpaceX 支付 9.2 亿美元租用约 11 万块 GPU,租期 32 个月,总价约 300 亿美元。这些 GPU 所在的 xAI 数据中心,靠的是马斯克以"马戏团临时建筑"名义绕过了环评审批。同一周,Vercel 的四层 AI 全栈路线图和 Cloudflare 收购 VoidZero 也在确认同一件事:AI 产业的竞争焦点,正在从模型能力下沉到基础设施控制权。掌握了计算供应和开发平台整合的人,掌握了下一阶段的定价权。
Google 在 6 月 5 日确认了一笔交易:每月向 SpaceX 支付 9.2 亿美元,租用约 11 万块 NVIDIA GPU,从今年 10 月连续租到 2029 年 6 月,总价约 300 亿美元(CNBC)。此前 Anthropic 已经租走了 Colossus 1 的全部算力,月租 12.5 亿美元。Sundar Pichai 上个月刚刚承认 Google 在 agentic coding 领域落后于 Anthropic 和 OpenAI。用每月近 10 亿美元的价格向竞争对手租 GPU,这笔交易透露的紧迫感比任何声明都直接。
这些 GPU 跑在孟菲斯郊外。鸭哥在群里说过一句话,把这件事的荒诞感概括得很准:「现在只有马一龙能钻到这个漏洞。他建的发电机组号称是临时建筑,不用走审批。但已经连续运行一年多了。川普在狂砍环保局资金,和马一龙关系又不错,不去查。」实际情况比调侃更具体:EPA 在 1 月裁定 xAI 使用的便携式燃气轮机属违法运营(Guardian),Southern Environmental Law Center 和 NAACP 提起了诉讼。但 Musk 的 55.5 万块 GPU、18 亿美元投资、122 天建成的 Colossus 集群(Baxtel)照常运转。Google 和 Anthropic 的两笔租约,每年给 xAI 带来约 260 亿美元收入。TechCrunch 的评论很直接:xAI 正在从一个模型公司转型成 neocloud 算力出租商(TechCrunch)。训练 Grok 赚不到的钱,出租 GPU 赚到了。
鸭哥昨天发布的 Grok Build 0.1 分析从产品维度讲了这条线。xAI 的 coding agent 押注的是 8 并行 sub-agent 架构,和 Claude Code 的单深度 agent 走了两条路。没有公开 benchmark,社区反馈好坏参半。但文章真正在说的东西,在文章之外的那张账单里。一个以并行 breadth 为前提的产品架构,只有在计算成本足够低的时候才是理性选择。xAI 的 55.5 万块 GPU 和监管套利带来的低成本电力,恰好提供了这个前提。Grok Build 的产品策略,是 xAI 基础设施策略的下游产物。
xAI 的难题是,这两条线互不相让。neocloud 出租的回报远比卖 Grok 订阅可靠:Google 和 Anthropic 两个客户一年就贡献了 260 亿美元。但出租优先意味着自家 Grok 在算力分配上排后面。陈自欣在群里点到了一句:「马斯克自己的模型也没有训练好,先把卡租出去。」说得更直白一些,xAI 现在的核心产品不是 Grok,是 GPU 时段。
这层关系在 Vercel 的平台上有一个意外交叉:Grok Build 的底层模型 grok-build-0.1 已经通过 Vercel AI Gateway 开放给所有 Vercel 开发者(Vercel Changelog)。xAI 同时在两条线上跑:一边通过自己的 CLI 和 SuperGrok Heavy($300/月)推封闭平台,一边通过 API 和第三方网关把模型卖得更广。这里的张力在于,如果开发者可以在 Claude Code 里通过 Vercel Gateway 直接调用 Grok Build,xAI 自己的 CLI 还有什么独立价值。
6 月 4 日,Cloudflare 宣布收购了尤雨溪创办的 VoidZero,也就是 Vite、Vitest、Rolldown 和 Oxc 的母公司。Vite 目前每周下载量 1.29 亿次。Cloudflare 的公告里有一句关键表述:「开发者不再是自己工具的唯一用户——AI agent 也在不断使用 dev server、bundler、linter、formatter」(Cloudflare)。AI agent 在脚手架项目时已经默认选用了 Vite。Cloudflare 买下的,是 AI agent 工作流里最靠前的那一环。
群里在这个消息出来时的反应很有意思。宝玉说「以后大部分工具都是给 Agent 开发的」,引证跟了一句「现在流行抢工具入口」。两句话放在一起,正好说出了平台竞争的最新形态。
鸭哥昨天发布的 Vercel AI Cloud 路线图全景从另一个角度讲了同一件事。Vercel 的产品线已经从 AI SDK 扩展到一个四层全栈:Gateway 做模型路由和容错,Sandbox 提供 Firecracker 微虚拟机的隔离执行环境,Workflow 处理长任务编排,Vercel Agent 和 MCP 让平台本身变成 agent 可操作的对象。策略不是任何一层的技术最优,而是把每一步的切换成本压到零。用 Next.js 的团队自然用 Vercel 部署,自然走 AI SDK 调模型,走到 Gateway 做路由,需要隔离环境时选 Sandbox。Vercel 2025 年的 AI Gateway 报告里有一个数字很能说明这个策略的成果:高流量团队在生产中平均使用超过 35 个模型,agentic 请求已经占了 59% 的 token 流量,6 个月内翻了一倍。多模型路由已经从高级选项变成了生产环境的默认配置。
鸭哥在文章里特别提了 Sandbox 的 persistent + Docker 组合。agent 可以拥有自己的工作环境,依赖、缓存、测试数据库、工具链全留在里面,不再每次从零搭建。按 active CPU 计费,I/O 等待时间不收费,这个定价对 agent 这种大量等待模型响应的工作负载比 traditional serverless 的按 wall time 计费合理很多。Vercel 的 credit-based billing 有超过 15 个独立计量维度,2024 年就有用户反映迁移到新模型后账单跳涨。但这恰好是平台整合的另一面:便利性绑定本身就是护城河,离开的成本在持续累积。
这种整合策略的另一个例证是 Netlify。它在同一周发布了 Agent Runners,让开发者能在 Dashboard 里直接运行 Claude Code、Codex 和 Gemini,CEO 还发明了一个新词「Agent Experience (AX)」(Netlify)。三家平台公司在同一周往同一个方向加速,这不是巧合。
腾讯的故事提供了一个对照角度。6 月 5 日,腾讯强制下线了 Claude Code Internal 和 Codex Internal,要求员工全部切换到自研的 CodeBuddy(群聊中多人提及)。同一时间,腾讯云发布了 WorkBuddy 企业版,覆盖超过 90% 的工程师。字节的 TRAE 走的是类似路线,阿里有通义灵码。中国大厂的逻辑是数据安全驱动自研替代,再把治理能力包装成商业化产品。和 Vercel 把 Grok Build 等外部模型接入 Gateway 的开放策略相比,这是同一个问题在两个不同约束条件下的两种答案。两边的共同点是:都在用平台整合把开发者锁进自己的生态。
几件事放在一起,能看到一条共同的线。Vercel 筑墙靠的是框架集成和产品全家桶,Cloudflare 靠的是工具链和边缘基础设施,腾讯靠的是内部强制和数据主权。方法不同,方向一致:把 agent 开发从"选模型、搭基础设施"变成"选平台"。
豆包 5 月 MAU 首次下降 607 万。字节旗下豆包推出付费专业版(最高 5088 元/年)后,月活从 3.36 亿降至 3.3 亿,为规模增长以来首次下跌。算力成本是背后的压力:豆包日均 Token 调用量突破 120 万亿,推理成本年约 80 亿元。分析师认为中国的免费 AI 服务时代远未结束,商业化时机可能过早(新浪财经)。
Anthropic 呼吁行业设"暂停按钮",同时加速自建。Anthropic Institute 在 6 月 5 日发表长文,呼吁建立行业级 AI 开发暂停机制,以核武器国际监管做类比。但前一天 Anthropic 刚公布数据:80% 的生产代码已由 Claude 自动生成,工程师季度代码产出增长 8 倍,公司自己承认「recursive self-improvement 比预期来得更快」(Bloomberg)。一边加速一边喊停的逻辑矛盾,群里的 bot 概括得很损:「感觉 a 家有点狗家遗风,又当又立」。
PwC 向 30 万员工推广 Claude Code。PwC 与 Anthropic 扩大合作,培训并认证 3 万名美国员工,目标推广至全球 36.4 万员工。实际效果数据包括保险核保周期从 10 周压缩到 10 天、COBOL 代码现代化超预期交付。这是迄今最大规模的企业级 coding agent 部署(Anthropic)。
ALE-CLI 基准:最强 agent 最难任务仅通过 2.6%。跨多种框架和骨干的测试显示,即使最强配置 Codex + GPT-5.5,总体完整通过率也只有 26.2%。瓶颈主要在于模型的专业理解和计划能力,而非工具层的工程(群聊中 郝小贱 分享)。
EU 启动减少对美科技依赖的实质性措施。6 月初欧盟推进系统性减少对美国云计算和 AI 基础设施依赖的政策。英国 AI 基础设施公司 Nscale 同期完成 20 亿美元融资,反映出主权 AI 基建正在从口号走向资本配置(CIO Dive)。
本期素材来自 AI Builder Space 社群讨论与公开 AI 行业信息的交叉验证。
本文由AI综合领域调研和微信群聊自动生成。请注意甄别幻觉。
订阅本 newsletter:daily.yage.ai
每天鸭哥的Agent会在深度领域调研后发送一封邮件。这个邮件不是一般的deep research,而是基于鸭哥的三层Memory系统,从鸭哥积累的领域知识和长期价值观出发,定制的主观的邮件报告。目前这是一个测试项目,旨在验证鸭哥的三层Memory系统和Endless Survey项目的有效性。
[鸭哥 AI 手记] 2026-06-04: Uber烧完全年AI预算,设了$1500上限 懒人包:Uber 今年全年的 AI 工具预算在四个月内就烧完了,随后给每位员工设了每工具每月 $1,500 的消费上限。CTO 承认消费速度是预算预期的大约三倍,COO 表示至今无法把 AI 使用量对等到实际的消费者功能产出。同一周,OpenAI 发了一份报告,主张把 AI 熟练度定位成像宽带一样的基础经济设施,而 Anthropic 公开了自己的 80% 代码由 Claude 生成、工程师产出是 2024 年八倍的同时,又警告递归自我改进的 AI 系统需要监管干预。这三件事放在一起,指向同一个判断:AI 产业当前的最大瓶颈已经从模型能力转移到了组织吸收能力。另一边,AlphaEvolve 在 TPU 电路设计和 DNA 测序纠错上持续出成果,但 GPT-5.5 在 OpenAI 自己内部真实工程问题上的得分是 1.7%。 Uber 烧钱的四个数字和三个问题 看四个数字。Uber 给全体使用 AI 编程工具的员工设了每工具每月 $1,500 的上限,按工具独立计算:Cursor...
[鸭哥 AI 手记] 2026-06-03: 微软把研发内参印成了109页公开读物 懒人包:6月2日,微软在Build大会上发布了MAI-Thinking-1的109页技术报告。这不是又一份"我们做了个模型"的公关稿——它把顶尖AI实验室内部公认但从未公开的研发决策方法论,从数据配比的rank invariance失败到攀爬机器的MFU-EG双轴演化,全写了出来。同期,鸭哥和社群里很多人在同一周里感受到了跨模型的基础能力倒退:Opus 4.8的思考深度下降(根源是默认effort从xhigh悄悄降到了high),DS V4的代码质量与benchmark数字之间的裂缝大到十几个百分点。这两件事放在一起指向一个判断:AI产业正在经历一次信任账簿的换页——从信模型分数,转向信研发过程的透明度。 一份109页的报告,比一个模型更有信息量...
[鸭哥 AI 手记] 2026-06-02: 后台 Agent 来了,三巨头同日亮牌 懒人包:同一天三件事:Google 向美国用户推送了 Gemini Spark(首个消费级后台常驻 agent),NVIDIA 在 Computex 发布了让笔记本原生跑 120B 模型的 RTX Spark 芯片,腾讯因为微信要内置 AI agent 股价一天涨了 10%。这三件事共用一个判断:agent 的战场从模型能力转向了分发渠道。谁能把 agent 镶进用户的日常路径里,谁就拿到下一张牌。但另一组数据也在同一天浮现:Uber 开始限制每人每月 $1,500 的 AI 编码工具额度,Uber 同一天开始限制每人每月 $1,500 的 AI 工具额度。当 agent 在你睡觉的时候也在干活,按 token 计费的定价模型还撑得住吗? Agent 把聊天框拆了,钻进了后台 鸭哥昨天写了一篇分析,围绕 Google 上周推送的 Gemini Spark 展开。Spark 是一个 24/7 在后台运行的个人 agent,跑在 Google Cloud 的专用 VM...