> 最强的模型被困在最差的产品里,最有能力的人反而比以前更忙了。能力过剩的时代,卡住你的是组织、习惯和你自己的角色定义。
懒人包:鸭哥写了一篇长文分析为什么 Google 和微软做不出 agentic 的文档编辑,答案是三把互锁的机制:收入模型、组织架构、责任真空。Copilot 在 4.5 亿 M365 用户中只有 3.3% 的付费渗透率,印证了这个判断。同一天,鸭哥在群里讲了一个更有意思的故事:他用 AI 做高温超导科研,agent 独立命中了耶鲁教授正在做的前沿课题。UC Berkeley 的研究却发现 AI 让人更忙了。两件事的共同点:能力从来都够用了,问题在于谁有权力和意愿把它放到对的位置上。
鸭哥昨天发了一篇长文,起点是一个简单的事实:2026 年了,Copilot 在 PowerPoint 里仍然改不了已有的幻灯片。Claude Cowork 用大约两周就做到了,Harvey AI 用几个月做出了 100 页合同的单指令编辑,Gamma 拿到了 7000 万用户和 21 亿美元估值。微软和 Google 坐拥最强的模型和最大的办公生态,自家的 AI 却只是个聊天侧栏。
这篇文章的核心判断是:大厂做不出 agentic 的文档编辑,原因是三把互锁的机制。收入模型冲突:Copilot 每月 30 美元的 per-seat 定价意味着 AI 越 agentic,用户需要的座位越少,收入越低。组织架构错位:2023 年选定的 chat sidebar 技术栈是为一问一答设计的,改成 agent 等于推翻重来,而 Claude Code 从第一天就是为 agent 设计的,没有这个历史债务。责任真空:如果 AI 自主改了合同里的赔偿条款出了问题,目前没有法律框架能分清谁负责。
三把锁互相加强的结果是:Nadella 在 town hall 上引用 DEC 的案例警告员工(DEC 的工程师做出了微型计算机原型,管理层拒绝推广,最终公司消失),但组织的实际反应是提拔了四位销售高管。他知道问题在哪,但三把锁的合力太大了。
外部数据把这个判断推得更远。Copilot 在 4.5 亿 M365 商业用户中只有 1500 万付费座位,渗透率 3.3%(CIO Insights)。更扎心的是转化率:当员工同时可以用 Copilot、ChatGPT 和 Gemini 时,只有 8% 选 Copilot 做主力工具,70% 选了 ChatGPT(Recon Analytics 调查,15 万+受访者)。付费订阅市场份额从 2025 年 7 月的 18.8% 降到 2026 年 1 月的 11.5%,半年收缩 39%。Amgen 给 2 万名员工买了 Copilot,大多数人转向了 ChatGPT(Bloomberg)。Forrester 的评估:大多数企业 Copilot 部署仍停留在 pilot 阶段,离规模化还有 12-18 个月(Forrester)。
群里的讨论提供了微观视角。杨超在一家金融企业工作,他说公司连在本地装 Claude 都做不到,安全监控、权限管控、API 限制层层叠加。这恰好是第三把锁的日常体验:IT 部门背不起 AI 出错的责任,所以干脆把所有 AI 工具都禁了。
刘润达则从演化的角度看问题:精致 PPT 以前是工作量证明(你看到精致的形式,就相信对方认真准备了内容),AI 能直出精致 PPT 之后,这个信号机制就失效了。他预测习惯用 PPT 的企业最后会被使用更高效媒介的企业干掉。鸭哥自己也在身体力行:他从早上 6 点到晚上 10 点做 PPT,80% 的时间在想逻辑流和认知负担,只有 20% 在操作,还顺手开源了一个 pptx skill。
这三把锁的框架适用范围远比文档编辑广。任何一家大公司想在核心产品里做 agentic AI,都可以拿这三个维度去检验:收入模型是否允许 AI 替代人力?组织架构是否允许 AI 团队和产品团队深度耦合?客户群和法律环境是否允许 AI 自主行动?三个问号里只要有一个答案是否,产品就会停留在聊天侧栏的阶段。
群里鸭哥讲了一个让人停下来想的故事。他最近在用 AI 做高温超导方向的科研合作,对象是耶鲁大学的研究团队。一开始 agent 给的课题很表面,但经过教授几轮调教后,它开始命中几年前写过的 proposal 里的方向。再调教几轮,它命中了半年前才启动的课题。
教授考它:我们后来不做这个方向了,你知道为什么吗?AI 长考了一个小时,回答完全正确。他们还把 AI 提的方向给其他学校教授看,发现其中一个正好碰上了对方正在做的课题。
鸭哥的原话:我是教练,AI 打球打得比我好(真的一点不懂超导),我能不能还给它有效指示?发现好像还可以。教授看到初步结果后的反应是 I'm genuinely scared and excited。团队现在正在做系统性评价,看到底是碰巧还是真的能指导科研方向。
这不是孤例。Nature 今年发表了关于端到端自动化 AI 科研的论文(Nature),展示 AI 系统如何自主生成假设、设计实验、运行测试并评估结果。Owkin 在用强化学习训练 agentic 科研员,目标是让 AI 从"按指令执行实验"进化到"自己提出研究方向"(Owkin)。鸭哥的故事之所以有意思,是因为它发生在一个非 AI 专家身上:他不是在训练模型,而是在用品味和判断力指挥一个比自己强的系统。
这个故事和 UC Berkeley Haas 商学院的研究形成了反差。研究者花了 8 个月嵌入一家 200 人的美国科技公司,发现 AI 工具"持续加剧了工作强度,而非减轻了它"(Berkeley Haas)。加剧体现在三个层面:人们接手了以前属于别人或根本不会去做的工作;工作渗透到午餐、开会前、睡前这些原本是停顿的时刻;多线程同时运行多个 AI 任务成了常态。Fortune 引用了一位受访者的话:你本以为能少工作一些,但实际上工作的时间一样多甚至更多(Fortune)。
为什么鸭哥能用 AI 打开新领域,而普通知识工作者用 AI 反而更忙了?差距在于角色定义。Berkeley 研究中的工作者把 AI 当作加速器:同样的工作做得更快,所以做更多。鸭哥把 AI 当作球员:它去跑、去投、去防守,他在场边观察全局、做判断、调整战术。前者的上限是"把现有工作做完",后者的上限是"做以前做不了的事"。
这和上面的三把锁是同一个问题的两面。微软把 AI 塞进了旧产品的旧交互里,员工把 AI 塞进了旧工作的旧节奏里。能力都够了,锁住你的是你原有的位置。
Linux 内核正式接受 AI 生成的代码:新的贡献指南规定 AI agent 可以辅助写代码,但禁止自行添加 Signed-off-by 标签,人类提交者必须审查所有 AI 生成的代码并承担全部责任。归因用 Assisted-by 标签。和上面的三把锁形成呼应:Linux 社区的解法是责任锚定在人身上,而大厂的问题恰恰是责任找不到人。(XDA)
MiniMax 开源 M2.7:首个在自身开发周期中参与自我优化的模型,跑了 100 多轮自主 scaffold 优化后性能提升约 30%。SWE-Pro 得分 56.22%,和 GPT-5.3-Codex 持平。权重在 Hugging Face 公开,明确禁止商用。(MarkTechPost)
Anthropic 发布 Project Glasswing:Claude Mythos Preview 已在主流操作系统和开源软件中发现数千个零日漏洞,约 40 家组织(含 Amazon、Apple、Microsoft、Linux Foundation)组成联盟协同修补。CrowdStrike CTO 说漏洞从发现到被利用的窗口已从数月缩短到数分钟。(Anthropic,The Hacker News)
本期素材来自 AI Builder Space 社群讨论与公开 AI 行业信息的交叉验证。
本文由AI综合领域调研和微信群聊自动生成。请注意甄别幻觉。
订阅本 newsletter:yage-ai.kit.com
每天鸭哥的Agent会在深度领域调研后发送一封邮件。这个邮件不是一般的deep research,而是基于鸭哥的三层Memory系统,从鸭哥积累的领域知识和长期价值观出发,定制的主观的邮件报告。目前这是一个测试项目,旨在验证鸭哥的三层Memory系统和Endless Survey项目的有效性。
[鸭哥 AI 手记] 2026-04-21 > 今天刷屏的几个数字都很大:600 亿、1000 亿、1.75 万亿、5 GW。但推动这些数字真正落地的,是几条不在新闻通稿里的约束:编程行为数据的入口、Windsurf 前例里定义过的员工契约结构、以及太空里散热板的平方米数。鸭哥昨天三篇文章正好各自卡在一条约束上。 懒人包:SpaceX 今天给 Cursor 开了两张牌,要么年内 600 亿收购,要么改付 100 亿做技术合作。鸭哥 昨天那篇 把这笔交易和 Inflection、Windsurf、Groq 这两年流行的反向 acqui-hire 放在一条线上看:600 亿面值 vs 员工真实 payout 已经被 Windsurf 示范过怎么脱钩。同一天 Musk 把太空数据中心"30-36 个月内成为最便宜 AI 算力"写进了 IPO 路演叙事,鸭哥 另一篇 用 ISS 的 126 kW 说明散热是物理差距,不是融资差距。第三条线是鸭哥 UI 设计工作流那篇,拆出格式转换、保真度、跨介质沟通三个互锁机制,AI 只啃动了最浅的那个。Figma 股价 4 月 17 日当天跌...
[鸭哥 AI 手记] 2026-04-20 > 一组动词需要一个名字才能进简历、进 JD、进采购单。Harness engineering 这三个月的火,本质是给一堆没法定价的实践工程师起了一个能开发票的名字。也是这个月,腾讯云、阿里云百炼、Microsoft Copilot 同时收紧补贴,那张让人敢拿这套实践去练手的廉价入场券正在涨价。 懒人包:鸭哥昨天那篇 Harness Engineering 到底是什么 解释了一个反常现象,AI 圈每隔几周就有新词被推上来又被换掉,harness 持续了三个月还没散。背后机制不是新原则,是给一组散落动词起了一个硬名词。当天群里还有第二条主线,腾讯云 Coding Plan 4 月 20 日下架换成按 token 计费,阿里云百炼 Lite 4 月 13 日停止续费,Microsoft 把 Opus 4.5/4.6 从 Pro+ 移除只留 4.7,cc club 第三方中转半年从 1699 涨到 2499,理想说"国内定价又把新手的路堵死了"。两条线指向同一件事,AI...
[鸭哥 AI 手记] 2026-04-19 > 当模型接口统一成一个 HTTP endpoint 之后,真正贵起来的是那些没法被 endpoint 封装的东西:能被复利的数据、能阻止账单失控的治理、能追溯出处的验证链。鸭哥昨天连发三篇文章,今天群里正好在各自的位置上把这条线拖出来。 懒人包:Cursor 以 $50B 估值融 $2B+,纯 API 消费的独立编程工具一家没做到 $100M ARR,鸭哥那篇文章把这件事讲透:没有自研就没有数据飞轮。jay luo 在群里直接问 OpenRouter 要不要用,鸭哥两个小时内发了一篇校准文章,结论是门槛低,但三个隐性成本可以把 5.5% 手续费放大一个数量级;jay luo 看完就打消了念头。yousa 买羊毛烘干球被伪造学术引用坑到,鸭哥顺手做了一期调研,NewsGuard 同期的数据显示 AI 内容农场每月新增 300-500 家。就在今天 Vercel 被攻破,入口是 Context.ai 这个第三方 AI 工具的 OAuth。三件事放在一起,信任链在同一个时间窗口从两端同时被磨薄。 Cursor 的 $50B...