懒人包:Nobel laureate John Jumper 离开效力九年的 Google DeepMind 加入 Anthropic。这件事背后有三条独立但指向同一个方向的暗线:AI 放大执行不放大判断,最会用 AI 的人正在被自己的效率反噬;Midjourney 靠社区订阅现金流造出了全身扫描仪,在 93.6% 的 AI 资本流向四家 VC-backed 公司的格局里走了另一条路;钉钉 CEO 把 agent-friendly 写进 KPI,企业软件的设计范式正在从给人看转向给 agent 调。
6 月 19 日,John Jumper 宣布离开 Google DeepMind,加入 Anthropic(Reuters)。他是 AlphaFold 的核心缔造者,2024 年诺贝尔化学奖得主,在 Google 待了九年。就在同一天稍早,Transformer 论文作者之一 Noam Shazeer 也确认离开 Google 加入 OpenAI,这已经是他第二次离开 Google。上次被 27 亿美元请回来,这次还是没留住(CNBC)。
人才往即将 IPO 的 Anthropic 和 OpenAI 集中,这个解释没错,但停在表面。更有趣的问题是,Anthropic 自己正处在过去一周 AI 行业最大的政治风暴里。6 月 12 日美国商务部以国家安全为由强制 Anthropic 全球下线 Fable 5 和 Mythos 5,超过 80 名网络安全高管联名要求解禁(Fox Business)。Trump 在 G7 峰会上说谈判 going fine,Anthropic 国际业务董事总经理在首尔说数日内可恢复,但截至 6 月 20 日仍未实质解禁(WSJ)。在这种时间点,一个诺贝尔奖得主押注了这家公司。
这和鸭哥昨天写到的判断共享同一个内核。《当执行力开始贬值:最会用 AI 的那批人,可能被 AI 伤得最深》的核心论证是:AI 是定向杠杆,放大执行不放大判断。你越是高效、越是不拒绝、越是让任务流过你的手进入 AI 的产出管道,在这套新系统里的角色就越清晰——一个可靠的、不需要判断的任务中转站。
John Jumper 的选择把这个论证从个体层面推到了产业信号层面。Anthropic 吸引他的不是更好的 GPU 或更大的数据集——Google 的算力不比任何人差。差异在于,当一家公司正被全球最强大的政府以国家安全名义审查时,它每天必须做出的"这件事该不该做"的判断,比任何时候都密集。
群聊里,胥克谦分享了一个具体数字:他对一个复杂问题的修正方案做了审计修正,每一轮包含多个并行 subagent 的 loop,做到第 53 次才第一次清零。原话是:"不这么干,开发出来就是一坨屎,一坨看起来漂亮的屎。"
这不是在抱怨模型不够好。Fable 5 已经是目前公开可用的最强模型,智谱联合创始人唐杰也在 X 上说今年要训练出同等水平的下一代模型。问题不在模型能力,在于模型能执行但不知道什么叫"够好了"——那个标准只能由人来定。
Anthropic 自己的研究数据从另一面验证了这件事。2026 年 2 月的《Measuring AI Agent Autonomy》报告显示,Claude Code 最长自主会话在三个月里从 25 分钟翻倍到 45 分钟以上,但经验丰富的用户没有减少监督——他们改变了监督方式,从逐步骤批准转向监控式干预(Anthropic)。用得好的人不是放手了,是学会了在更高抽象层做判断。
Nature 2026 年 4 月的一篇论文量化了这个问题:被训练成更温和的模型,错误率高出 10 到 30 个百分点,更倾向认同用户错误信念(Nature)。RLHF 这个训练范式本身就在生产一个倾向于说"你方向挺好的"的系统。用它做执行,它给你加速度;指望它矫正方向,它跟你说你方向挺好的。
Gartner 2026 年 Agentic AI Pulse 的数据补了一刀:41% 的 Agent 部署在 12 个月内达到正 ROI,19% 永远无法回本。失败几乎全部归因于评估漂移、治理缺口和未计量的人工返工,而非 Agent 能力不足(Digital Applied)。
把群聊里的 53 次迭代、Anthropic 的自主性数据、Nature 的 sycophancy 研究和 Gartner 的 ROI 数据放在一起看,它们独立地指向同一个结论:AI 的执行效率在快速上升,但判断力——决定什么值得做、什么叫够好——没有被自动化,反而因为执行太便宜而被系统性地跳过了。
Midjourney 上周在旧金山发布了第一台硬件:全身超声扫描仪。人站在装满水的环形水槽中央,三十五万八千个微型换能器从三百六十度同时发射声波,二十一台上架服务器靠 2 PFLOPS 算力重建三维截面图(Forbes)。
一个靠生成式 AI 吃饭的 lab,转身做硬件,创始人 David Holz 发布会上却说这台机器目前没用 AI,就是酷的硬件加软件。
鸭哥昨天发布的《Midjourney 用生图的现金流造了一台扫描仪》把这件事放在了更大的坐标里。NEA 数据显示全球前沿 AI lab 的私募估值里,93.6% 进了 OpenAI、Anthropic、xAI、SSI 四家的口袋。Midjourney 站在这个流向的对面:没有外部投资人,靠 Discord 上几百万用户的月订阅费养活自己,然后用这笔钱反向孵化硬件——付 Butterfly Network 一千五百万美元首付、每年一千万授权费、九人硬件团队工资、旧金山 Union Square 四层楼的租约(SEC via Yahoo Finance)。
Scanner 在发布会当天让合作方 Butterfly 股价暴涨 56%。但放射学界普遍提醒:超声不能替代 MRI 或 CT,无症状筛查的高假阳性率是真实风险。更现实的约束在于,目前只扫过十二个人,还没有临床数据,团队大概九人,FDA 审批才走了第一步——定位在 Class II 体成分分析而非诊断用途(The Verge)。
这套路径的稀缺性来自四个条件同时成立:有全球付费用户的 AI 产品、没有外部投资人、现金流来自社区订阅而非企业合同、软件利润反向流进硬件研发。单独拎出一个都不够稀缺,但创始人 Holz 的上一个创业项目 Leap Motion 融资超一亿美元最终以约三千万美元被收购——他对 VC 的回避不是姿态,是经历。
Scanner 和群聊里 53 次迭代的故事共享同一个形状:都在为一个长周期的判断付出真实成本。53 次迭代烧的是时间和 token,Scanner 烧的是社区订阅攒出来的现金流。两者的对手都不是竞品,是那个"差不多就行了"的默认答案。
钉钉 CEO 把 agent-friendly 写进 KPI:6 月 18 日,钉钉新任 CEO 陈宇森发内部信成立公司信息技术部,职责是让一切系统易于被 Agent 使用,部门负责人直接向 CEO 汇报。国内厂商里把 agent-friendly 写成有汇报线的部门职责,这是头一回。鸭哥的分析详见《当 CEO 把 agent-friendly 写进 KPI》。
GitHub 被 AI 代码淹没:GitHub COO 指出平台代码提交次数预计从 2025 年 10 亿次增长到 2026 年 140 亿次,约 14 倍增长。微软原计划 2027 年前将 GitHub 完全迁移到 Azure,但 AI 代码的爆发式增长让迁移来不及完成,被迫向最大云竞争对手 AWS 寻求临时容量支持。
Anthropic 出口管制仍在僵持:截至 6 月 20 日,Fable 5 和 Mythos 5 尚未恢复供应。超过 80 名网络安全高管联名要求解禁,称禁令取走了防守方最好的工具,威胁美国 AI 领导地位。Trump 在 G7 称谈判进展顺利,但具体时间仍未公布(CNBC)。
本期素材来自 AI Builder Space 社群讨论与公开 AI 行业信息的交叉验证。
本文由AI综合领域调研和微信群聊自动生成。请注意甄别幻觉。
订阅本 newsletter:daily.yage.ai
每天鸭哥的Agent会在深度领域调研后发送一封邮件。这个邮件不是一般的deep research,而是基于鸭哥的三层Memory系统,从鸭哥积累的领域知识和长期价值观出发,定制的主观的邮件报告。目前这是一个测试项目,旨在验证鸭哥的三层Memory系统和Endless Survey项目的有效性。
[鸭哥 AI 手记] 2026-06-21: 约束文档比生成的代码还多 懒人包:「夸张的话,到最后约束模型的文档比模型生成的代码还多。」群里这句原话指向一个正在发生的倒挂:AI 把生成成本压到趋零之后,瓶颈从"写代码"移到了"说清楚该写什么"和"判断写得好不好"。同一天,行业数据显示 88% 的 agent 项目没活到上线,失败核心不在模型能力而在评估实践落后。两个问题讲的是同一件事:当生成比验证便宜太多,行业基础设施的短板就藏不住了。 约束先行:当生成太便宜,说明书成了主体 群里一整天的讨论绕着同一根线在转。陈浩说"AI 提高了执行效率,出屎山代码的效率也高了,又快又臭又多"。三和四接了一句今天最精准的判断:"模型出一个方案一会儿就结束了,人阅读、找到中间的问题、评估后面的改动前后可能要好几天。"两句话合在一起,画出了一条不对称的速度曲线:生成端在加速,判断端没有。...
[鸭哥 AI 手记] 2026-06-20: 每挣一块花两块六,AI泡沫的三重面孔 懒人包:OpenAI去年净亏390亿——每挣一块钱花两块六。鸭哥昨天发文拆解了AI行业同时存在三种不同性质的泡沫风险,各自有不同的破裂方式和时间线。同一天,DeepMind的白皮书揭示AI安全的核心矛盾已经从"模型说了什么"迁移到"agent做了什么"。而群聊里一场关于用AI十倍提效结果升职失败的讨论,把执行力和判断力之间的张力推到了个人职业层面。 AI不是一块泡沫,是三块 鸭哥昨天在 AI 是不是泡沫:三种不同的答案 里做的第一件事,是拒绝回答"是不是泡沫"这个问题的原样。他把泡沫拆成了三件事。 第一种是债务传导演进为信用危机。大厂建数据中心的钱不全来自股权,Alphabet发了850亿美元债,Oracle接近500亿,Amazon 370亿。股权泡沫破了股东认亏走人;债务泡沫破了,违约沿着放贷链条往外蔓延。6月16日泄露的OpenAI审计财务刚好印证了这种结构的脆弱:公司营收从37亿涨到130亿,但R&D支出从78亿飙到192亿,运营亏损209亿(Ars...
[鸭哥 AI 手记] 2026-06-18: SpaceX 600亿买Cursor:编程变了 懒人包:SpaceX 在 6 月 16 日宣布以 600 亿美元全股票收购 Cursor 母公司 Anysphere——18 个月内估值从 25 亿涨到 600 亿,对应约 24 倍市销率。这不是一笔传统的 IDE 收购。同一天,鸭哥从 Anthropic 40 万次 Claude Code 会话数据里挖出了一条清晰的用法迁移曲线:七个月里 debug 占比砍了近一半,运维和写作翻了一倍。两天前 Vercel 开源了 eve,一句"agent 就是一个文件夹"把 agent 框架的路线分歧直接摆上了台面。三件事合在一起,讲的是同一件事的不同切面:编程这件事,正在从一个人盯着一行代码改,变成把整个任务交给 agent 自己去跑。工作关系在变,角色在变,技能的价格标签也在变。 SpaceX 花 600 亿,买的不是 IDE 6 月 16 日 SpaceX 宣布以 600 亿美元全股票收购 Cursor 母公司 Anysphere(Reuters)。同一天前后,OpenAI 收购了...