[鸭哥 AI 手记] 2026-04-12

> 最强的模型被困在最差的产品里，最有能力的人反而比以前更忙了。能力过剩的时代，卡住你的是组织、习惯和你自己的角色定义。

懒人包：鸭哥写了一篇长文分析为什么 Google 和微软做不出 agentic 的文档编辑，答案是三把互锁的机制：收入模型、组织架构、责任真空。Copilot 在 4.5 亿 M365 用户中只有 3.3% 的付费渗透率，印证了这个判断。同一天，鸭哥在群里讲了一个更有意思的故事：他用 AI 做高温超导科研，agent 独立命中了耶鲁教授正在做的前沿课题。UC Berkeley 的研究却发现 AI 让人更忙了。两件事的共同点：能力从来都够用了，问题在于谁有权力和意愿把它放到对的位置上。

Copilot 坐拥 4.5 亿用户，只卖出了 3.3%

鸭哥昨天发了一篇长文，起点是一个简单的事实：2026 年了，Copilot 在 PowerPoint 里仍然改不了已有的幻灯片。Claude Cowork 用大约两周就做到了，Harvey AI 用几个月做出了 100 页合同的单指令编辑，Gamma 拿到了 7000 万用户和 21 亿美元估值。微软和 Google 坐拥最强的模型和最大的办公生态，自家的 AI 却只是个聊天侧栏。

这篇文章的核心判断是：大厂做不出 agentic 的文档编辑，原因是三把互锁的机制。收入模型冲突：Copilot 每月 30 美元的 per-seat 定价意味着 AI 越 agentic，用户需要的座位越少，收入越低。组织架构错位：2023 年选定的 chat sidebar 技术栈是为一问一答设计的，改成 agent 等于推翻重来，而 Claude Code 从第一天就是为 agent 设计的，没有这个历史债务。责任真空：如果 AI 自主改了合同里的赔偿条款出了问题，目前没有法律框架能分清谁负责。

三把锁互相加强的结果是：Nadella 在 town hall 上引用 DEC 的案例警告员工（DEC 的工程师做出了微型计算机原型，管理层拒绝推广，最终公司消失），但组织的实际反应是提拔了四位销售高管。他知道问题在哪，但三把锁的合力太大了。

外部数据把这个判断推得更远。Copilot 在 4.5 亿 M365 商业用户中只有 1500 万付费座位，渗透率 3.3%（CIO Insights）。更扎心的是转化率：当员工同时可以用 Copilot、ChatGPT 和 Gemini 时，只有 8% 选 Copilot 做主力工具，70% 选了 ChatGPT（Recon Analytics 调查，15 万+受访者）。付费订阅市场份额从 2025 年 7 月的 18.8% 降到 2026 年 1 月的 11.5%，半年收缩 39%。Amgen 给 2 万名员工买了 Copilot，大多数人转向了 ChatGPT（Bloomberg）。Forrester 的评估：大多数企业 Copilot 部署仍停留在 pilot 阶段，离规模化还有 12-18 个月（Forrester）。

群里的讨论提供了微观视角。杨超在一家金融企业工作，他说公司连在本地装 Claude 都做不到，安全监控、权限管控、API 限制层层叠加。这恰好是第三把锁的日常体验：IT 部门背不起 AI 出错的责任，所以干脆把所有 AI 工具都禁了。

刘润达则从演化的角度看问题：精致 PPT 以前是工作量证明（你看到精致的形式，就相信对方认真准备了内容），AI 能直出精致 PPT 之后，这个信号机制就失效了。他预测习惯用 PPT 的企业最后会被使用更高效媒介的企业干掉。鸭哥自己也在身体力行：他从早上 6 点到晚上 10 点做 PPT，80% 的时间在想逻辑流和认知负担，只有 20% 在操作，还顺手开源了一个 pptx skill。

这三把锁的框架适用范围远比文档编辑广。任何一家大公司想在核心产品里做 agentic AI，都可以拿这三个维度去检验：收入模型是否允许 AI 替代人力？组织架构是否允许 AI 团队和产品团队深度耦合？客户群和法律环境是否允许 AI 自主行动？三个问号里只要有一个答案是否，产品就会停留在聊天侧栏的阶段。

教练不需要比球员跑得快，但需要看得见球场

群里鸭哥讲了一个让人停下来想的故事。他最近在用 AI 做高温超导方向的科研合作，对象是耶鲁大学的研究团队。一开始 agent 给的课题很表面，但经过教授几轮调教后，它开始命中几年前写过的 proposal 里的方向。再调教几轮，它命中了半年前才启动的课题。

教授考它：我们后来不做这个方向了，你知道为什么吗？AI 长考了一个小时，回答完全正确。他们还把 AI 提的方向给其他学校教授看，发现其中一个正好碰上了对方正在做的课题。

鸭哥的原话：我是教练，AI 打球打得比我好（真的一点不懂超导），我能不能还给它有效指示？发现好像还可以。教授看到初步结果后的反应是 I'm genuinely scared and excited。团队现在正在做系统性评价，看到底是碰巧还是真的能指导科研方向。

这不是孤例。Nature 今年发表了关于端到端自动化 AI 科研的论文（Nature），展示 AI 系统如何自主生成假设、设计实验、运行测试并评估结果。Owkin 在用强化学习训练 agentic 科研员，目标是让 AI 从"按指令执行实验"进化到"自己提出研究方向"（Owkin）。鸭哥的故事之所以有意思，是因为它发生在一个非 AI 专家身上：他不是在训练模型，而是在用品味和判断力指挥一个比自己强的系统。

这个故事和 UC Berkeley Haas 商学院的研究形成了反差。研究者花了 8 个月嵌入一家 200 人的美国科技公司，发现 AI 工具"持续加剧了工作强度，而非减轻了它"（Berkeley Haas）。加剧体现在三个层面：人们接手了以前属于别人或根本不会去做的工作；工作渗透到午餐、开会前、睡前这些原本是停顿的时刻；多线程同时运行多个 AI 任务成了常态。Fortune 引用了一位受访者的话：你本以为能少工作一些，但实际上工作的时间一样多甚至更多（Fortune）。

为什么鸭哥能用 AI 打开新领域，而普通知识工作者用 AI 反而更忙了？差距在于角色定义。Berkeley 研究中的工作者把 AI 当作加速器：同样的工作做得更快，所以做更多。鸭哥把 AI 当作球员：它去跑、去投、去防守，他在场边观察全局、做判断、调整战术。前者的上限是"把现有工作做完"，后者的上限是"做以前做不了的事"。

这和上面的三把锁是同一个问题的两面。微软把 AI 塞进了旧产品的旧交互里，员工把 AI 塞进了旧工作的旧节奏里。能力都够了，锁住你的是你原有的位置。

也值得知道

Linux 内核正式接受 AI 生成的代码：新的贡献指南规定 AI agent 可以辅助写代码，但禁止自行添加 Signed-off-by 标签，人类提交者必须审查所有 AI 生成的代码并承担全部责任。归因用 Assisted-by 标签。和上面的三把锁形成呼应：Linux 社区的解法是责任锚定在人身上，而大厂的问题恰恰是责任找不到人。（XDA）

MiniMax 开源 M2.7：首个在自身开发周期中参与自我优化的模型，跑了 100 多轮自主 scaffold 优化后性能提升约 30%。SWE-Pro 得分 56.22%，和 GPT-5.3-Codex 持平。权重在 Hugging Face 公开，明确禁止商用。（MarkTechPost）

Anthropic 发布 Project Glasswing：Claude Mythos Preview 已在主流操作系统和开源软件中发现数千个零日漏洞，约 40 家组织（含 Amazon、Apple、Microsoft、Linux Foundation）组成联盟协同修补。CrowdStrike CTO 说漏洞从发现到被利用的窗口已从数月缩短到数分钟。（Anthropic，The Hacker News）

本期素材来自 AI Builder Space 社群讨论与公开 AI 行业信息的交叉验证。

本文由AI综合领域调研和微信群聊自动生成。请注意甄别幻觉。

订阅本 newsletter：yage-ai.kit.com

鸭哥每日AI要闻

[鸭哥 AI 手记] 2026-04-12

[鸭哥 AI 手记] 2026-04-12

Copilot 坐拥 4.5 亿用户，只卖出了 3.3%

教练不需要比球员跑得快，但需要看得见球场

也值得知道

[鸭哥 AI 手记] 2026-04-21

[鸭哥 AI 手记] 2026-04-20

[鸭哥 AI 手记] 2026-04-19