[鸭哥 AI 手记] 2026-05-19: Karpathy入Anthropic,管道战争开打


[鸭哥 AI 手记] 2026-05-19: Karpathy入Anthropic,管道战争开打

> 九个单词。Andrej Karpathy 在 X 上发了这么多,就宣布了加入 Anthropic。同一天 Anthropic 花超过 3 亿美元买下 Stainless,收购当天关停托管,OpenAI 和 Google 自动同步多语言 SDK 的能力直接消失。一件事选人,一件事断路,对照着看是同一场战争的两个侧面。

懒人包:Karpathy 选了 Anthropic,没回 OpenAI。他要组一个新团队,用 Claude 研究怎么训练更好的 Claude,也就是 AI 训练 AI 的闭环。鸭哥昨天写了篇长文分析 Anthropic 半年内的四笔收购,给了一个判断:这些被收购的东西几乎全是开源的,MIT 许可证允许任何人 fork,但 AI lab 宁愿花几亿买,因为团队认知、路线图控制和竞对截胡的能力,fork 拿不到。群聊里鸭哥补了最狠的一句:「事实的商战:你用什么软件,收购那家公司断你的线。」另一条线上,Google I/O 今天发布 Gemini 3.5 Flash,同时把 Vertex AI 改名为 Google Agent Platform,群里的开发者已经在吐槽迁移赶不上改名。

Karpathy 的九个单词

Karpathy 发的推原文是"Personal update: I joined Anthropic."没有更多解释。方向是明确的:他加入的是 Anthropic 预训练团队,要组建一个新团队,用 Claude 来研究怎么训练更好的 Claude(Axios)。

这件事被确认后,群里炸了。郝越在群里分析得最细:「老马有段时间天天骚扰他让他重新出山,他都不肯……说明 LLM 很有可能确实又要有突破了。」他指的是马斯克。Karpathy 曾是 Tesla 的 AI 总监,带队做了纯视觉自动驾驶方案。更早之前他是 OpenAI 的创始成员,斯坦福师从李飞飞,创建了全球播放量最高的深度学习课程 CS231n。2025 年他发明了 vibe coding 这个词,2026 年开源了 autoresearch,一个让 AI agent 自动跑 ML 实验的项目。他每次造词都踩在行业拐点上。

这次选了 Anthropic 而不是回 OpenAI。群里有人开玩笑说「怕鸭哥突然发这么一条」,另一个接「然后三周以后辞职,跟 boris 去 cursor 一样」。玩笑归玩笑,Karpathy 的用脚投票本身就是一个信号:AI 最稀缺的不是模型参数,是能定义行业范式的那一小群人。鸭哥文章里写过一个同构的判断:买开源公司的真正理由是团队认知,fork 拿不到原团队对每一行的理解。Karpathy 这九个单词,是同一条逻辑的个人版本。


三亿断供,和群里那场真实的商战课

鸭哥昨天在群里分享了刚写好的文章,《既然都是开源的,为什么还要花几亿去买》。文章梳理了 Anthropic 半年内的四笔收购:Bun(JS 运行时,被 Claude Code 用作分发载体)、Vercept(西雅图 AI agent 公司)、Coefficient Bio(成立仅 8 个月、不到 10 人的生物技术公司,约 4 亿美元全股票)、Stainless(SDK 生成工具,超 3 亿美元)。OpenAI 在同一时期收购了 Astral,uv 和 Ruff 的团队,月下载量过亿次(Astral 官方)。

这些被收购的东西几乎全是开源的。Bun 是 MIT 许可证,uv 也是 MIT,Stainless 生成的 SDK 代码客户拥有完整版权。任何一条路都允许零成本的 fork。但 AI lab 宁愿花几亿。

鸭哥文章给了四层分析:第一,团队认知——原团队对每一行代码的理解,fork 拿不到;第二,依赖可靠性——Claude Code 年化收入超过 10 亿美元,运行时绑在一家零收入创业公司上,上游如果被竞对收购或倒闭,fork 能护住代码但你要扛全部维护成本;第三,竞对截胡——如果 OpenAI 买了 Bun,Claude Code 的运行时依赖就捏在对手手里,fork 阻止不了这件事;第四,路线图控制——fork 是防守,收购是进攻。收购后 Bun 的优先级向 Claude Code 倾斜,Stainless 的托管产品直接关闭。

群里鸭哥说了一句最狠的话:「事实的商战:你用什么软件,收购那家公司断你的线。」他管这叫 Denial of infrastructure attack,基础设施层面的拒绝服务。不是攻击服务器,是让你没有服务器可用。

Bun 的故事刚好印证了后面一层逻辑。收购后创始人 Jarred Sumner 宣布将约 100 万行 Zig 代码用 Rust 重写。六天内完成合并,99.8% 的已有测试通过,整个过程大量依赖 AI agent 辅助(DevClass)。Zig 的社区在同一时期发布了 AI 代码贡献禁令,理由是 AI 辅助贡献者无法建立对代码库的长期理解(Loris Cro 博文)。一个用 AI 四天重写了 100 万行,一个明文禁止 AI 碰代码。两条路同时发生。

Stainless 这边更直接。Forbes 用了 infrastructure denial play 这个词(Forbes)。Stainless 客户名单覆盖了 AI API 生态的核心层:OpenAI、Google、Meta、Cloudflare、Replicate、Runway。收购当天 Anthropic 宣布关闭所有托管产品。OpenAI 的 Node SDK 不仅是 Stainless 生成的代码,发布脚本也上传到 pkg.stainless.com。现在这些全没了。

VC 层面存在交叉持股:a16z 同时投资了 Anthropic、OpenAI、Stainless(被 Anthropic 收购)、Astral(被 OpenAI 收购)。无论买方还是卖方胜出,同样的资本都在获利。2026 年 Q1 全球风投创下 2970 亿美元历史记录,AI 公司拿了 1880 亿(Intellizence)。


Google 把 Vertex AI 改没了

Google I/O 今天在山景城开幕。发布清单包括:Gemini 3.5 Flash 上线、3.5 Pro 推迟到下月、Gemini Spark 个人 agent、Android 17 深度集成 Gemini Intelligence、Gemini Omni Flash 视频生成、WebMCP 开放标准、Antigravity 2.0 agent IDE。Pichai 宣布今年资本支出 1800 到 1900 亿美元,Gemini 月活 9 亿。

Gemini 3.5 Flash 的基准测试数据有看点:GPQA 90.4%(超过 3.1 Pro 的 86.4%),AIME 2025 95.2%(3.1 Pro 88%),SWE-bench Verified 78%(3.1 Pro 59.6%),输出速度是其他前沿模型的约 4 倍。定价每百万 token 输入 1.5 美元、输出 9 美元,是上一代 3 Flash Preview 的三倍(Simon Willison 分析)。

但群里完全没有在讨论基准测试。郝越的原话是:「我上周才整明白 genkit 跟 vertex ai sdk 区别,这周告诉我 vertex ai 没了。」Oversea 接过话,说改名叫 Google Agent Platform,加了一句判断:「可能都是 KPI,我们成功地将 Vertex AI 升级为 Agent Platform,大大提升了 Impact。」鸭哥的评论和往常一样克制:「google ppt 一如既往做的很好看,看看实际体感如何。」

对一个每天要用的开发者来说,Vertex AI 改名意味着 SDK 和 API endpoint 会变,文档分散在新旧站点之间,Genkit、ADK、Antigravity SDK 之间的关系需要自己判断。Google 在三家中的策略是在协议层推 A2A(Agent-to-Agent)和 WebMCP,同时提供 Antigravity 作为 agent IDE。Anthropic 走的是 MCP 标准化加 Claude Code 杀手级工具的路线,OpenAI 走 Responses API 加多模型路由。三家都在推自己的协议。

郝越补了另一句:「gemini 我从来不看基准测试,只看价格。」在竞争焦点从模型搬到管道的这一年,这句话反过来也成立:光看价格不看管道,一样会踩空。


也值得知道

Meta 明天裁员 8000 人:裁约 10% 员工,7000 人转岗至 AI 部门,冻结 6000 个空缺,总影响约 21000 个职位。新组织引入 AI Builder 职级,目标 75% 代码由 AI 生成。2026 年 Q1 全行业裁员已超 113000 人(Reuters)。

字节砍掉 30% AI 项目,腾讯换船:Forbes 报道字节内部文件显示已削减约 30% 的 AI 应用项目,2025 年 AI 推理成本超 80 亿元人民币,是 AI 产品增量收入的 2.3 倍。马化腾 5 月 13 日股东大会上称腾讯已经换船(Forbes)。

xAI 联合创始人单飞,融资 10 亿美元:Igor Babuschkin 创立 River AI,与 General Catalyst 谈判估值 50 亿美元。xAI 被 SpaceX 以 2500 亿美元收购后,11 位联合创始人已全部离职(Forbes)。


本期素材来自 AI Builder Space 社群讨论与公开 AI 行业信息的交叉验证。

本文由AI综合领域调研和微信群聊自动生成。请注意甄别幻觉。

订阅本 newsletter:yage-ai.kit.com

鸭哥每日AI要闻

每天鸭哥的Agent会在深度领域调研后发送一封邮件。这个邮件不是一般的deep research,而是基于鸭哥的三层Memory系统,从鸭哥积累的领域知识和长期价值观出发,定制的主观的邮件报告。目前这是一个测试项目,旨在验证鸭哥的三层Memory系统和Endless Survey项目的有效性。

Read more from 鸭哥每日AI要闻

[鸭哥 AI 手记] 2026-05-26: AI VP说:你的Harness是脚手架 懒人包:昨天,一位 Microsoft AI 的技术领导者告诉群友 LangSensei:你现在写的 harness 全是 throwaway work,AI 总有一天自己会学会。同一天,鸭哥在发文章讲 Skills 积累才是护城河。两个人的判断指向同一个问题,但答案刚好相反:当 AI 本身在进化时,你建在上面的东西到底能撑多久?另一条线,群里在认真讨论 OPC 还做不做得下去——2025 年 12 月之后被判断为"九死一生",但真在做的人发现,AI 拉平技术执行的同时,把信任和判断推成了真正的瓶颈。 你赌的是 AI 会从哪个方向进化 LangSensei 在群里分享了和一位 Microsoft AI 技术负责人的对话,开头就很直白。他之前一直觉得应该做一个最好用的 harness,驾驭 AI 做出更好的产品。大佬说这是错的——"AI 跟人一样,会进化。你要 harness 一个会进化的东西,本质上是不可能的。" 大佬给的替代方案更像训练模型:搭一个最简单的脚手架,提供成熟的...

[鸭哥 AI 手记] 2026-05-25: Claude不到4%,AI全自动办公还远 懒人包:Claude Opus 4.7 在北京智源的一场办公大考中只做完了 3.8% 的任务。106 项只过了 4 项。同一天发生的是:Walden Yan 公开修正了自己 10 个月前反对多 Agent 的判断;微软内部弃用了 Claude Code;Uber 的 5000 名工程师四个月烧完全年 AI 预算但 COO 承认无法证明 ROI;而 79% 的企业声称在用 AI Agent,只有 11% 真正跑在生产环境。五件事同时出现在一个窗口,不是巧合。AI 工具快速变强了,但组织真正用起来的能力,还差着好几层。 Claude Opus 4.7 只拿 3.8%:Agent 全自动办公卡在哪 北京智源人工智能研究院(BAAI)最近发布的 SaaS-Bench 测试,把这个问题照得很清楚。他们让 AI Agent 在真实的 SaaS 环境中操作计算机,做财务人员最日常的工作:创建客户、开发票、记录付款、账户对账。106 个任务,从几步到 200 多步不等,每个任务有多个检查点。 最强的...

[鸭哥 AI 手记] 2026-05-24: 83%的PR被关,规则在重写 > Flask 作者 Armin Ronacher 的 Pi 项目过去 90 天收到 3145 条外部贡献,83% 被自动关闭。714 个 PR 里只有 60 个最终合入。他写的不是抱怨贴。文章里抛出的那句话更尖锐:标准已经改了,只是没人通知你。同一天,美国三十多个州的居民在用投票告诉科技公司同一件事。 懒人包:Ronacher 的数据说明了一个简单的逻辑:AI 没有让谁变差,AI 放大了你本来就有的模式。会判断的人被放大了判断力,不会的人被放大了错误。当 Ronacher 的 tracker 里 83% 的贡献被拒、Virginia 居民对数据中心支持率从 62% 跌到 23%,两个信号指向的其实是同一件事——旧标准撑不住新现实了。另外,一篇 2026 年提交 NeurIPS 的论文发现,大多数 RAG 场景下最简单的聚类方案就够用,这个判断和前两件事共享同一个底层逻辑:什么时候不补就够用,比怎么补更快更有用。 83% 的 PR 被关掉,尺子换了 鸭哥昨天在群里分享了他刚写的文章。《你编程十年,但在...