[鸭哥 AI 手记] 2026-06-18: SpaceX 600亿买Cursor:编程变了


[鸭哥 AI 手记] 2026-06-18: SpaceX 600亿买Cursor:编程变了

懒人包:SpaceX 在 6 月 16 日宣布以 600 亿美元全股票收购 Cursor 母公司 Anysphere——18 个月内估值从 25 亿涨到 600 亿,对应约 24 倍市销率。这不是一笔传统的 IDE 收购。同一天,鸭哥从 Anthropic 40 万次 Claude Code 会话数据里挖出了一条清晰的用法迁移曲线:七个月里 debug 占比砍了近一半,运维和写作翻了一倍。两天前 Vercel 开源了 eve,一句"agent 就是一个文件夹"把 agent 框架的路线分歧直接摆上了台面。三件事合在一起,讲的是同一件事的不同切面:编程这件事,正在从一个人盯着一行代码改,变成把整个任务交给 agent 自己去跑。工作关系在变,角色在变,技能的价格标签也在变。

SpaceX 花 600 亿,买的不是 IDE

6 月 16 日 SpaceX 宣布以 600 亿美元全股票收购 Cursor 母公司 Anysphere(Reuters)。同一天前后,OpenAI 收购了 Ona(前身为 Gitpod,79 人团队),Salesforce 花 36 亿美元买下 Fin(前身为 Intercom)。三笔交易在同一周落定,标的完全不同,但底下是同一套逻辑。

Cursor 被收购前的 ARR 轨迹本身说明问题。2025 年 1 月约 1 亿美元,到 2026 年 3 月冲到了 20 亿美元以上。18 个月 20 倍增速,估值从 25 亿涨到 600 亿,约 24 倍市销率。鸭哥昨天在这篇分析里把收购动机挖到了一层更关键的差别上:盯着改的 agent 积累的是代码补全片段,整个交出去的 agent 积累的是完整任务生命周期数据。一个复杂任务怎么被拆成几步,中间在哪卡住,怎么恢复,怎么验证做对了——后者的训练价值远高于前者。想训练一个能独立完成复杂任务的下一代 agent,"这段代码怎么补"的数据训练不出来,需要的是"这个任务怎么从头到尾跑完"的轨迹。

OpenAI 买 Ona 的逻辑也一样。Ona 做的是持久化云端执行环境,让 agent 能长时间安全运行,这是 Codex 从交互式工具走向独立执行者的基础设施。Salesforce 买 Fin,买的是客服场景里 agent 独立完成任务的 30000 多家客户和完整记录。三家买的都不是用户量或者代码仓库,买的是同一件东西:让 agent 独立工作的数据和运行环境。

Goldman Sachs 从 2025 年 7 月开始试点 Devin,自主解决率约 13.9%,生产力提升 3 到 4 倍(CNBC)。成功率还远低于交互式模式,但方向已经清楚。

这桩交易的规模还有一个容易被忽略的侧面。Q1 2026 全球 AI 风投总额约 3000 亿美元,并购约 1.22 万亿。在这个量级下,SpaceX 用全股票交易花掉约 3.4% 的稀释拿到 Cursor,OpenAI 在 8520 亿美元估值下收购 Ona。和任何一个行业的基础设施投资周期比起来,这笔钱虽然是天文数字,但逻辑是一致的:在基建还没有铺完的时候,拥有铺设权的公司值这个价。


40 万次会话的量尺:debug 不是消失了,是散开了

6 月 16 日,Anthropic 发布了基于约 40 万次 Claude Code 真实会话的分析报告(AnthropicPDF),时间跨度 2025 年 10 月到 2026 年 4 月。

七个月里,debug 占的会话比例从 33% 落到了 19%,砍了将近一半。腾出来的份额流向了运维和写作,各自翻了一倍。运维从 14% 涨到 21%,写作和数据分析从约 10% 涨到约 20%。整体看,超过四成的会话不以写代码为核心目的。鸭哥昨天在这篇分析里把这条线拉得很清楚:debug 没有消失,只是不再单独占一次会话了。它嵌进了更大的工作流。你打开 AI 不再是为了修一个 bug,而是为了跑完一件事。

只有你把量尺切到更细的地方,差距才真正显出来。顺风顺水的时候,新手和专家的验证成功率差不太多。但在困难会话里,新手达到验证成功的只有 4%,专家 15%,差了将近四倍。放弃率讲的是同一件事的反面:新手有 19% 以放弃告终,其他用户只有 5% 到 7%。差距不在顺的时候,在卡住的时候。

METR 今年 5 月对 349 名技术工作者做的调查提供了一个独立的参照。50% 的受访者经常使用 Claude Code,中位自报速度提升约 3 倍,但价值提升只有 1.4 到 2 倍(METR)。METR 特别指出了一个容易踩的坑:速度提升的自我报告会显著高估实际产出价值,因为用 AI 加速的那些任务,有一部分没有 AI 的时候根本不会去做。

报告里的另一个角度在这里接上了。用 AI 写代码的人也在变。约 70% 的会话能推断出职业,增长最快的是管理、销售和法律。律师用它查合同缺失条款,销售总监用它调后端 SQL,产品经理用它改 CI 配置文件。软件相关从业者的验证成功率是 34%,其他职业是 29%,最大差距在七个百分点以内。编程的门槛从会不会写代码,移到了能不能说清要解决的问题。

群聊里的反馈提供了同一个判断的实操版本。有人提到基座模型变更以后过去的提示词要重新审视,"执行力度会发生偏移"。另一个群友说 Anthropic 公开数据显示用 AI 后的真实产出率只有没有 AI 的 4 到 5 倍,"只有 0-20% 可以完全不需要人监督"。这些数字和报告里的"专家在困难会话里成功率 15%"放在一起看,讲的是同一件事:AI 让大多数人快了,但只有少数人让它真的省了。快了和省了之间有一步关键的距离,这步距离不在模型能力里,在人对问题的理解深度里。


一个文件夹就是一个 agent:Vercel 把路线分歧摆上了台面

6 月 17 日 Vercel 在伦敦 Ship 大会上以 Apache 2.0 协议开源了 eve(GitHub)。官方博客的标题就是一句话:An agent is a directory。一个 agent 就是一个文件夹。

这句话冲撞了我们心里对 agent 框架的默认设定。过去两年搭 agent,基本是两条路。LangChain 的路线是用 Python 把 Tool、Chain、Memory 拼到一起,自己管注册、管部署。Anthropic 的路线是在 Claude 的云上配几个 connector,让 Claude 把触手伸到你的 Slack 和数据库。eve 说这两条路都走偏了。它把 agent 当独立软件来建:文件系统做定义,Git 管版本,一条命令部署上线。

鸭哥昨天在这篇分析里把三种路线的核心分歧拆开了。三种做法的背后,是同一个问题给出的三个不同答案:agent 到底是什么。LangChain 把它当成编程问题,答案是零件你自己拼。Anthropic 把它当成模型的延伸,答案是给 Claude 开几扇门。eve 把它当成独立软件,答案是一个文件夹。这不是功能多少的差别,是路线分歧。

eve 的设计把三件事各对准了竞品缺失的那一环。第一,文件名就是注册——agent/tools/run_sql.ts 这个文件名本身就是工具名,框架 build 时自动发现,不需要写任何胶水代码。第二,agent 是你真正拥有的软件——就是一个 Git 仓库,改一句 instruction 是一个 commit,有 diff 可 review,有历史可追溯。每笔 commit 自动生成 preview deploy,eve eval 接入 CI 当 deploy gate。第三,生产运行时打包进同一个目录——durable execution 让部署不打断正在跑的 session,Sandbox 在隔离 microVM 里跑 agent 写的代码,Channels 让同一个 agent 同时出现在 Slack、Discord、Teams 上。

群聊里一位群友描述了自己的 agent 组织方式,和 eve 的目录约定形成了不经意的对照:"一个独立长程任务,有一个 agent.md 统筹,一组 script 用工具做确定性计算,一组 skill 做非确定性计算,一个 product 作为可复用的输出"。这是在没有 eve 的时候自己发明的结构,说明文件名即约定的需求是真实的,不是 Vercel 的一家之谈。

发布两天后 eve 在 GitHub 上拿到约 1100 个 star。Hacker News 上只有 3 分和 2 条评论,社区反响偏冷。但这可能不是产品的问题,而是方向的问题:eve 要解决的 agent 生产化,大部分开发者还没跑到那个阶段。正如鸭哥在那篇文章结尾写的:单独 eve 能跑,但输出可能停在共识层,正确但平庸。单独 context infrastructure 有深度,但没有生产运行时。两者放一起才是完整的拼图。eve 负责运行,context infrastructure 负责认知内容。


也值得知道

Transformer 作者 Noam Shazeer 离开 Google 加入 OpenAI:Google Gemini 联合负责人、2017 年 Transformer 论文《Attention Is All You Need》的合著者 Noam Shazeer 于 6 月 18 日离职并加入 OpenAI,将领导 AI 架构研究。Google 两年前花了约 27 亿美元通过收购 Character.AI 才把他带回。Sam Altman 称 Shazeer"我从 OpenAI 创立之初最想共事的人之一"。一周内前有 SpaceX 花 600 亿买工具,后有 OpenAI 从 Google 挖走 Transformer 的奠基人,人才和工具两端的争夺都在同一个方向上加速(Ynetnews)。

Anthropic Fable 5 出口管制事件持续:截至 6 月 18 日,Fable 5 和 Mythos 5 仍未恢复访问。Fortune 同日发表深度报道,揭示 Amazon CEO Andy Jassy 的电话推动了政府指令,特朗普科学顾问 David Sacks 与 Anthropic 意见冲突。Anthropic 月前已秘密提交 IPO 申请,估值 9650 亿美元(Fortune)。

爱沙尼亚为 AI Agent 赋予法定身份代码:爱沙尼亚正在试行给予 AI Agent 法定身份标识,为日益无法无天的互联网增加问责机制。这件事放在 SpaceX 买 Cursor 的同一天看,讲的是同一个问题的远端:当 agent 真的能独立做事了,谁为它做的事负责(Gizmodo)。


本期素材来自 AI Builder Space 社群讨论与公开 AI 行业信息的交叉验证。

本文由AI综合领域调研和微信群聊自动生成。请注意甄别幻觉。

订阅本 newsletter:daily.yage.ai

鸭哥每日AI要闻

每天鸭哥的Agent会在深度领域调研后发送一封邮件。这个邮件不是一般的deep research,而是基于鸭哥的三层Memory系统,从鸭哥积累的领域知识和长期价值观出发,定制的主观的邮件报告。目前这是一个测试项目,旨在验证鸭哥的三层Memory系统和Endless Survey项目的有效性。

Read more from 鸭哥每日AI要闻

[鸭哥 AI 手记] 2026-06-20: 每挣一块花两块六,AI泡沫的三重面孔 懒人包:OpenAI去年净亏390亿——每挣一块钱花两块六。鸭哥昨天发文拆解了AI行业同时存在三种不同性质的泡沫风险,各自有不同的破裂方式和时间线。同一天,DeepMind的白皮书揭示AI安全的核心矛盾已经从"模型说了什么"迁移到"agent做了什么"。而群聊里一场关于用AI十倍提效结果升职失败的讨论,把执行力和判断力之间的张力推到了个人职业层面。 AI不是一块泡沫,是三块 鸭哥昨天在 AI 是不是泡沫:三种不同的答案 里做的第一件事,是拒绝回答"是不是泡沫"这个问题的原样。他把泡沫拆成了三件事。 第一种是债务传导演进为信用危机。大厂建数据中心的钱不全来自股权,Alphabet发了850亿美元债,Oracle接近500亿,Amazon 370亿。股权泡沫破了股东认亏走人;债务泡沫破了,违约沿着放贷链条往外蔓延。6月16日泄露的OpenAI审计财务刚好印证了这种结构的脆弱:公司营收从37亿涨到130亿,但R&D支出从78亿飙到192亿,运营亏损209亿(Ars...

[鸭哥 AI 手记] 2026-06-19: AlphaFold之父跳槽Anthropic,判断力在重新定价 懒人包:Nobel laureate John Jumper 离开效力九年的 Google DeepMind 加入 Anthropic。这件事背后有三条独立但指向同一个方向的暗线:AI 放大执行不放大判断,最会用 AI 的人正在被自己的效率反噬;Midjourney 靠社区订阅现金流造出了全身扫描仪,在 93.6% 的 AI 资本流向四家 VC-backed 公司的格局里走了另一条路;钉钉 CEO 把 agent-friendly 写进 KPI,企业软件的设计范式正在从给人看转向给 agent 调。 AlphaFold 之父换队,判断力的溢价刚刚开始 6 月 19 日,John Jumper 宣布离开 Google DeepMind,加入 Anthropic(Reuters)。他是 AlphaFold 的核心缔造者,2024 年诺贝尔化学奖得主,在 Google 待了九年。就在同一天稍早,Transformer 论文作者之一 Noam Shazeer 也确认离开...

[鸭哥 AI 手记] 2026-06-17: Fable 5 下线第五天,GLM-5.2 开源了 懒人包:6 月 12 日美国政府一纸出口管制指令让 Fable 5 全球下线,四天后智谱以 MIT 许可证发布了 GLM-5.2,在 Artificial Analysis Intelligence Index 上拿下 51 分,成为开源模型里综合能力最强的那个。推理模型赛道的博弈焦点,正在从"谁会推理"转向"谁能被访问、花多少钱被访问"。同一天,鸭哥还写了另一件事:AI 系统里积攒的规则会随时间退化,一条半年前就该删除的 workaround,直到昨天还在被每一个新 agent 照搬执行。 Fable 5 下线,GLM-5.2 上线:推理模型的竞争已经从能力烧到了供应链 6 月 9 日 Anthropic 发布 Claude Fable 5,三天后就被美国商务部援引出口管理条例强制下线,原因是 Amazon CEO 向财政部报告其研究人员用 Fable 5 获取了可用于网络攻击的信息(The Guardian)。截至 6 月 17 日,Fable 5 和 Mythos 5...