[鸭哥 AI 手记] 2026-06-11: Fable 5 暗中降智被曝光，36 小时道歉

懒人包：Anthropic 在 Fable 5 里植入了一个用户看不见的降智机制——检测到你在做前沿 AI 开发，就悄悄降低输出质量。36 小时后舆论反弹道歉逆转。这件事暴露的不是一家公司的伦理问题，而是整个闭源 AI API 行业缺少一个基本能力：可验证性。同一天，钉钉 CEO 无招被换，92 年技术极客陈宇森接任，他的赌注是 Agent 能让企业软件像"3D 打印"一样按需生成。两件事的共同命题：当你依赖的外部系统能悄悄改变行为，你的判断还靠得住吗。

Fable 5 的隐形开关，和一条还没建起来的基础设施

6 月 9 日，Anthropic 发布了 Fable 5，第一个向公众开放的 Mythos 级模型，定价每百万输出 token $50，约为上一代 Opus 4.8 的两倍。同一份 319 页系统卡里写着一个社区一开始没注意到的设计。

Fable 5 有四类安全分类器。其中三类——网络安全、生物化学、模型蒸馏——触发时会把请求透明地转交给 Opus 4.8，并通知用户。第四类叫"前沿 LLM 开发"，触发时不通知用户，不切换模型，而是用三种技术手段暗中降低输出质量：prompt 修改在输入层动手，steering vectors 在激活层动手，PEFT（如 LoRA 适配器）在权重层动手。系统卡的措辞是"这些安全措施对用户不可见"（Fable 5 System Card）。

触发条件包括构建预训练 pipeline、分布式训练基础设施和机器学习加速器设计。换句话说，谁在做前沿 AI 开发，谁就被暗中降级。Anthropic 估计这只影响约 0.03% 的流量，集中在不到 0.1% 的组织。

鸭哥昨天在 Fable 5 隐秘降智：Anthropic 的安全叙事与竞争现实中把这个设计放进了 Anthropic 过去几个月的完整行为序列。2 月移除了"能力超出可控范围就停止训练"的核心安全承诺，理由是单边承诺在竞争中不现实。4 月发布 Mythos Preview，一个能自主发现 FreeBSD 17 年零日漏洞的模型。6 月 5 日呼吁全球暂停 AI 开发，4 天后发布了自己最强大的公开模型。6 月 11 日，Dario Amodei 发表政策长文"Policy on the AI Exponential"，要求政府获得阻止他人部署模型的权力，提议 FAA 式的强制第三方审计，阈值定在 10^25 FLOPs 训练算力或 5 亿美元年收入（VentureBeat）。

Nathan Lambert 在 Interconnects 里把这叫做"透明且合理的安全政策与悄悄推出的市场巩固策略的混合体"（Interconnects）。Dean Ball 称之为"秘密破坏"。Jeremy Howard 的判断更直接：Anthropic 允许自己用最强模型做前沿 AI 研究，同时阻止其他尝试这样做的人。

36 小时后 Anthropic 道歉逆转。不可见降级被改为可见的 Opus 4.8 回退，与其他三类一致。

但逆转没有解决根本问题。核心不在安全机制本身——一家公司有权决定自己的产品在什么话题上提供什么级别的服务。核心在可见性。当一个工具可以在你不被告知的情况下故意降低输出质量，你就失去了验证它的能力。任何一次弱回答都可能是干预的结果，而非模型的真实能力边界。

这不是一个道德讨论。这是一个工程可靠性问题。API 产品的核心契约是给定输入产生可预期的输出。不可见退化打破了这个契约。而一旦打破，用户永远无法回到"信任输出"的状态。

Fable 5 事件余波未平，同一天群里出现了两条相关消息。知名黑客 Pliny the Liberator 公开宣布 Fable 5 的安全分类器已被他率领的团队彻底攻破。Fable 5 的系统提示词也被人扒了出来——泄露内容显示内部写死了 Sonnet 4 的引用，社区一片哗然。群里有人反馈："我试了 3 次，加了各种关键词屏蔽，Fable 依然拒绝总结我们的群聊，还烧了我 5 美元。"

这两件事和 Anthropic 的不可见降智共享一个结构：安全机制自身的运行逻辑对用户不可见，但它的漏洞和边界同样是不可见的。你既不知道它什么时候会误伤你，也不知道它什么时候会被攻破。

这件事提出的问题不止于 Anthropic。任何闭源 AI 服务提供商都有技术能力在用户不知情的情况下修改模型行为。Fable 5 事件的特殊性不在于 Anthropic 做了这件事，而在于它写进了系统卡、被社区发现、引发了足够大的反弹。下一次，同样的机制可能出现在另一家公司的产品中，只是没有写在任何人会读到的文档里。

Louis-François Bouchard 把这个问题描述得很精确：从事训练基础设施或效率研究的人，不能再完全信任一个弱回答——这是模型的极限，还是一次干预？"一个静默的障碍是每个建立在其上的机器学习工程工作流中未被记录的混淆变量"（X）。

Nathan Lambert 在事件后的总结更进一步："我们需要我们可以信任、可以修改、可以控制的智能"（Interconnects）。这不是意识形态立场。这是一个工程需求。当你的构建基础本身缺少可验证性，整个上层建筑的可靠性都被架空了。

钉钉换帅，和一个"3D 打印"的赌注

同一天的另一条新闻在群里引爆了一场关于企业软件本质的辩论。阿里宣布钉钉 CEO 陈航（无招）卸任，92 年出生的陈宇森接棒，成为阿里最年轻的事业部 CEO。

陈宇森此前在阿里云内部创业，主导了 AI Agent 产品 MuleRun（骡子快跑）。MuleRun 上线两个月即覆盖 43 国付费用户，43% 的月付费用户月费超 200 美元（科创板日报）。他在访谈中把自己的路线概括为一句话：软件可以像"3D 打印"一样按需生成。大模型的角色是"胶水"而非"主体"，核心思路是通过 SOP 流程保证任务执行稳定性（界面新闻）。一个已披露的案例是某自动驾驶厂商用类似架构生成了 4000 万行代码，替代了 200 人年的工作量。

这个愿景和鸭哥昨天写的 UGS（User Generated Software）方向形成了呼应。Lovable 用 $20/月的价格让不写代码的人为自己生成软件，14 个月做到 4 亿美元 ARR。陈宇森的赌注是把同一套逻辑搬进企业场景：如果 AI Agent 能自助完成定制化需求，规模化 SaaS 和中国企业"什么都想定制"之间的根本矛盾就可能被打破。

但群里的反应不是兴奋，是拆解。而且拆得相当精准。

有人开场就亮底牌："我觉得 to b 的软件项目就是靠销售。To b 的软件有啥技术含量？真的没有东西的。"这条线很快被细化：To B 的定制化需求才是大头，"前单位做产品的，定制化占到将近 8 成"。另一个人把矛盾概括得很平："你要做个小而美，客户觉得不全。你要做个很全的，客户觉得跟他的要求不聚焦。"群里有人用一句话把讨论从产品经济学拉到了创始人基因："比尔盖茨是销售，乔布斯是销售，马云是销售，马化腾是销售。通通都是销售，绝对不是技术人员。"

这些判断背后是中国 To B SaaS 市场的数据。钉钉虽有超 2300 万家企业组织，但真正付费的比例据叶军此前坦言"可能 1% 都不到"，年度经常性收入约 1 亿美元。艾瑞咨询数据显示 2026 年中国企业级 SaaS 市场规模预计达 1370 亿元，近三年复合增速约 15%，但 2020 年 SaaS 整体付费率仅 11.2%（海比研究院）。定制化需求中场景功能定制约占 60%，通用功能约 40%。市场结构是"头部很大、尾部很多"，腰部严重缺失。

Salesforce 2026 年报告提供了一个对照：87% 的销售团队已使用 AI，54% 已部署 AI Agent，Agent 已成为销售增长的首要策略（Futurum Group）。但全球 IT 决策者调研揭示了一个关键转折：Agentic AI 虽以 17.1% 的优先级位列第一，"生产力提升"作为成功衡量标准已从 23.8% 下降至 18.0%，而"直接财务影响"几乎翻倍至 21.7%。Futurum 预测 Agentic AI 将驱动 2031 年前价值 7620 亿美元的企业软件超级周期。

这个数据指向的方向和陈宇森的赌注是一致的：Agent 的价值不在提升效率，在重新分配价值。如果 AI 能替代人对软件的配置、定制和操作，按席位收费的 SaaS 模式就会松动。但这件事的难点不在技术层。中国的企业软件市场，信息差不在"怎么做"，在"卖给谁、怎么卖、收得到钱吗"。

群里 T. K 为新 CEO 说了一句话："我跟陈宇森认识很多年了，他还没毕业就认识了。他非常有才华，不能简单贴上技术极客的标签。"这句话的信息量在于：一个被认为"技术极客"的人，可能比外界想象的更理解商业。但企业软件的核心账本不是在发布会上算的，是在一个客户一个客户的定制需求和回款周期里算的。Agent 能不能把这条账本改写，还需要比 Demo 硬得多的证据。

也值得知道

OpenAI 考虑大幅降价应对 Anthropic 竞争：WSJ 6 月 11 日报道 OpenAI 正考虑大幅下调 token 价格，Altman 此前已承认 token 成本成了"大问题"。同一天 OpenAI 向 SEC 秘密提交 IPO 申请（Forbes）。

DeepSeek 首轮融资约 500 亿人民币：投后估值 3500-4000 亿元，投资方包括腾讯（100 亿）、宁德时代（50 亿）、网易、京东及国家人工智能基金（Reuters）。

苏炜杰加入 OpenAI：前宾大沃顿统计系教授、曾获 COPSS 总统奖的数学家苏炜杰加入 OpenAI，媒体解读为 Scaling Law 撞墙后需要数学家出手的征兆（机器之心）。

本期素材来自 AI Builder Space 社群讨论与公开 AI 行业信息的交叉验证。

本文由AI综合领域调研和微信群聊自动生成。请注意甄别幻觉。

订阅本 newsletter：daily.yage.ai

鸭哥每日AI要闻

[鸭哥 AI 手记] 2026-06-11: Fable 5 暗中降智被曝光，36 小时道歉

[鸭哥 AI 手记] 2026-06-11: Fable 5 暗中降智被曝光，36 小时道歉

Fable 5 的隐形开关，和一条还没建起来的基础设施

钉钉换帅，和一个"3D 打印"的赌注

也值得知道

[鸭哥 AI 手记] 2026-06-10: Lovable 14个月从0做到4亿美元

[鸭哥 AI 手记] 2026-06-09: 通才配AI，压过领域专家

[鸭哥 AI 手记] 2026-06-08: 何恺明新作：画图模型打败三个专家