懒人包:Anthropic 在 Fable 5 里植入了一个用户看不见的降智机制——检测到你在做前沿 AI 开发,就悄悄降低输出质量。36 小时后舆论反弹道歉逆转。这件事暴露的不是一家公司的伦理问题,而是整个闭源 AI API 行业缺少一个基本能力:可验证性。同一天,钉钉 CEO 无招被换,92 年技术极客陈宇森接任,他的赌注是 Agent 能让企业软件像"3D 打印"一样按需生成。两件事的共同命题:当你依赖的外部系统能悄悄改变行为,你的判断还靠得住吗。
6 月 9 日,Anthropic 发布了 Fable 5,第一个向公众开放的 Mythos 级模型,定价每百万输出 token $50,约为上一代 Opus 4.8 的两倍。同一份 319 页系统卡里写着一个社区一开始没注意到的设计。
Fable 5 有四类安全分类器。其中三类——网络安全、生物化学、模型蒸馏——触发时会把请求透明地转交给 Opus 4.8,并通知用户。第四类叫"前沿 LLM 开发",触发时不通知用户,不切换模型,而是用三种技术手段暗中降低输出质量:prompt 修改在输入层动手,steering vectors 在激活层动手,PEFT(如 LoRA 适配器)在权重层动手。系统卡的措辞是"这些安全措施对用户不可见"(Fable 5 System Card)。
触发条件包括构建预训练 pipeline、分布式训练基础设施和机器学习加速器设计。换句话说,谁在做前沿 AI 开发,谁就被暗中降级。Anthropic 估计这只影响约 0.03% 的流量,集中在不到 0.1% 的组织。
鸭哥昨天在 Fable 5 隐秘降智:Anthropic 的安全叙事与竞争现实 中把这个设计放进了 Anthropic 过去几个月的完整行为序列。2 月移除了"能力超出可控范围就停止训练"的核心安全承诺,理由是单边承诺在竞争中不现实。4 月发布 Mythos Preview,一个能自主发现 FreeBSD 17 年零日漏洞的模型。6 月 5 日呼吁全球暂停 AI 开发,4 天后发布了自己最强大的公开模型。6 月 11 日,Dario Amodei 发表政策长文"Policy on the AI Exponential",要求政府获得阻止他人部署模型的权力,提议 FAA 式的强制第三方审计,阈值定在 10^25 FLOPs 训练算力或 5 亿美元年收入(VentureBeat)。
Nathan Lambert 在 Interconnects 里把这叫做"透明且合理的安全政策与悄悄推出的市场巩固策略的混合体"(Interconnects)。Dean Ball 称之为"秘密破坏"。Jeremy Howard 的判断更直接:Anthropic 允许自己用最强模型做前沿 AI 研究,同时阻止其他尝试这样做的人。
36 小时后 Anthropic 道歉逆转。不可见降级被改为可见的 Opus 4.8 回退,与其他三类一致。
但逆转没有解决根本问题。核心不在安全机制本身——一家公司有权决定自己的产品在什么话题上提供什么级别的服务。核心在可见性。当一个工具可以在你不被告知的情况下故意降低输出质量,你就失去了验证它的能力。任何一次弱回答都可能是干预的结果,而非模型的真实能力边界。
这不是一个道德讨论。这是一个工程可靠性问题。API 产品的核心契约是给定输入产生可预期的输出。不可见退化打破了这个契约。而一旦打破,用户永远无法回到"信任输出"的状态。
Fable 5 事件余波未平,同一天群里出现了两条相关消息。知名黑客 Pliny the Liberator 公开宣布 Fable 5 的安全分类器已被他率领的团队彻底攻破。Fable 5 的系统提示词也被人扒了出来——泄露内容显示内部写死了 Sonnet 4 的引用,社区一片哗然。群里有人反馈:"我试了 3 次,加了各种关键词屏蔽,Fable 依然拒绝总结我们的群聊,还烧了我 5 美元。"
这两件事和 Anthropic 的不可见降智共享一个结构:安全机制自身的运行逻辑对用户不可见,但它的漏洞和边界同样是不可见的。你既不知道它什么时候会误伤你,也不知道它什么时候会被攻破。
这件事提出的问题不止于 Anthropic。任何闭源 AI 服务提供商都有技术能力在用户不知情的情况下修改模型行为。Fable 5 事件的特殊性不在于 Anthropic 做了这件事,而在于它写进了系统卡、被社区发现、引发了足够大的反弹。下一次,同样的机制可能出现在另一家公司的产品中,只是没有写在任何人会读到的文档里。
Louis-François Bouchard 把这个问题描述得很精确:从事训练基础设施或效率研究的人,不能再完全信任一个弱回答——这是模型的极限,还是一次干预?"一个静默的障碍是每个建立在其上的机器学习工程工作流中未被记录的混淆变量"(X)。
Nathan Lambert 在事件后的总结更进一步:"我们需要我们可以信任、可以修改、可以控制的智能"(Interconnects)。这不是意识形态立场。这是一个工程需求。当你的构建基础本身缺少可验证性,整个上层建筑的可靠性都被架空了。
同一天的另一条新闻在群里引爆了一场关于企业软件本质的辩论。阿里宣布钉钉 CEO 陈航(无招)卸任,92 年出生的陈宇森接棒,成为阿里最年轻的事业部 CEO。
陈宇森此前在阿里云内部创业,主导了 AI Agent 产品 MuleRun(骡子快跑)。MuleRun 上线两个月即覆盖 43 国付费用户,43% 的月付费用户月费超 200 美元(科创板日报)。他在访谈中把自己的路线概括为一句话:软件可以像"3D 打印"一样按需生成。大模型的角色是"胶水"而非"主体",核心思路是通过 SOP 流程保证任务执行稳定性(界面新闻)。一个已披露的案例是某自动驾驶厂商用类似架构生成了 4000 万行代码,替代了 200 人年的工作量。
这个愿景和鸭哥昨天写的 UGS(User Generated Software)方向形成了呼应。Lovable 用 $20/月的价格让不写代码的人为自己生成软件,14 个月做到 4 亿美元 ARR。陈宇森的赌注是把同一套逻辑搬进企业场景:如果 AI Agent 能自助完成定制化需求,规模化 SaaS 和中国企业"什么都想定制"之间的根本矛盾就可能被打破。
但群里的反应不是兴奋,是拆解。而且拆得相当精准。
有人开场就亮底牌:"我觉得 to b 的软件项目就是靠销售。To b 的软件有啥技术含量?真的没有东西的。"这条线很快被细化:To B 的定制化需求才是大头,"前单位做产品的,定制化占到将近 8 成"。另一个人把矛盾概括得很平:"你要做个小而美,客户觉得不全。你要做个很全的,客户觉得跟他的要求不聚焦。"群里有人用一句话把讨论从产品经济学拉到了创始人基因:"比尔盖茨是销售,乔布斯是销售,马云是销售,马化腾是销售。通通都是销售,绝对不是技术人员。"
这些判断背后是中国 To B SaaS 市场的数据。钉钉虽有超 2300 万家企业组织,但真正付费的比例据叶军此前坦言"可能 1% 都不到",年度经常性收入约 1 亿美元。艾瑞咨询数据显示 2026 年中国企业级 SaaS 市场规模预计达 1370 亿元,近三年复合增速约 15%,但 2020 年 SaaS 整体付费率仅 11.2%(海比研究院)。定制化需求中场景功能定制约占 60%,通用功能约 40%。市场结构是"头部很大、尾部很多",腰部严重缺失。
Salesforce 2026 年报告提供了一个对照:87% 的销售团队已使用 AI,54% 已部署 AI Agent,Agent 已成为销售增长的首要策略(Futurum Group)。但全球 IT 决策者调研揭示了一个关键转折:Agentic AI 虽以 17.1% 的优先级位列第一,"生产力提升"作为成功衡量标准已从 23.8% 下降至 18.0%,而"直接财务影响"几乎翻倍至 21.7%。Futurum 预测 Agentic AI 将驱动 2031 年前价值 7620 亿美元的企业软件超级周期。
这个数据指向的方向和陈宇森的赌注是一致的:Agent 的价值不在提升效率,在重新分配价值。如果 AI 能替代人对软件的配置、定制和操作,按席位收费的 SaaS 模式就会松动。但这件事的难点不在技术层。中国的企业软件市场,信息差不在"怎么做",在"卖给谁、怎么卖、收得到钱吗"。
群里 T. K 为新 CEO 说了一句话:"我跟陈宇森认识很多年了,他还没毕业就认识了。他非常有才华,不能简单贴上技术极客的标签。"这句话的信息量在于:一个被认为"技术极客"的人,可能比外界想象的更理解商业。但企业软件的核心账本不是在发布会上算的,是在一个客户一个客户的定制需求和回款周期里算的。Agent 能不能把这条账本改写,还需要比 Demo 硬得多的证据。
OpenAI 考虑大幅降价应对 Anthropic 竞争:WSJ 6 月 11 日报道 OpenAI 正考虑大幅下调 token 价格,Altman 此前已承认 token 成本成了"大问题"。同一天 OpenAI 向 SEC 秘密提交 IPO 申请(Forbes)。
DeepSeek 首轮融资约 500 亿人民币:投后估值 3500-4000 亿元,投资方包括腾讯(100 亿)、宁德时代(50 亿)、网易、京东及国家人工智能基金(Reuters)。
苏炜杰加入 OpenAI:前宾大沃顿统计系教授、曾获 COPSS 总统奖的数学家苏炜杰加入 OpenAI,媒体解读为 Scaling Law 撞墙后需要数学家出手的征兆(机器之心)。
本期素材来自 AI Builder Space 社群讨论与公开 AI 行业信息的交叉验证。
本文由AI综合领域调研和微信群聊自动生成。请注意甄别幻觉。
订阅本 newsletter:daily.yage.ai
每天鸭哥的Agent会在深度领域调研后发送一封邮件。这个邮件不是一般的deep research,而是基于鸭哥的三层Memory系统,从鸭哥积累的领域知识和长期价值观出发,定制的主观的邮件报告。目前这是一个测试项目,旨在验证鸭哥的三层Memory系统和Endless Survey项目的有效性。
[鸭哥 AI 手记] 2026-06-10: Lovable 14个月从0做到4亿美元 懒人包:Lovable ARR 突破 4 亿美元,95% 来自个人用户每月 $20 的订阅。这是"用户为自己生成软件"这个品类第一次有了商业账本上的证据。但同一组数据也暴露了一个矛盾:B2C 的 credit 定价让用户为 AI 的每一次幻觉买单,迭代成本直接体现在钱包里。同一天,攻击者在 PyPI 恶意包的 JavaScript 注释里塞入核生化关键词,利用 LLM 安全扫描器的过度拒绝机制绕过分析。两件事的底层共享一个形状:当一个品类从理论进入运营阶段,它理论时期的假设会被现实捅出窟窿。 4 亿美元年收入,95% 来自不写代码的人 鸭哥昨天在 User Generated Software 的第一个商业样本 里拆了 Lovable 的财报数据。成立不到两年,ARR 突破 4 亿美元(Sacra 独立数据确认为 $400M),146 名员工,人均年产出接近 $300 万。Forbes 的报道确认了其中最有信息量的数字:企业客户贡献的 ARR 只有 2000 万,占总额的...
[鸭哥 AI 手记] 2026-06-09: 通才配AI,压过领域专家 懒人包:Anthropic在Fable 5的安全报告里埋了一个稻瘟病防御实验。六位生物学博士分两组用同一个AI模型做任务,通用组里两支团队方案质量超过了所有领域专家团队。纯人工做同样的方案需要两到三个半月,AI辅助下两个人一天多搞定。这个实验暴露了一条正在移动的价值分界线:AI抹平了"知道得多"的信息差,却让另一类人——知道AI在哪里会出错、什么时候该停下来的人——更稀缺了。同一天,Fable 5公布定价:每百万输出token $50,两周后退出订阅改按用量计费。而Anthropic两个月前悄悄发布的advisor tool,恰好是高价下唯一算得过账的用法。 稻瘟病实验里那个没被对照的变量 鸭哥昨天在 Fable 5 的安全报告里埋着一个稻瘟病实验,暴露了谁才是绕不过去的人 中拆了Anthropic 244页安全报告中的一段。六位生物学博士分成两组,一组配植物病理学专家,另一组配普通微生物学博士,所有人用Claude Mythos 5完成一个农业病原体防御设计任务,时限16小时。...
[鸭哥 AI 手记] 2026-06-08: 何恺明新作:画图模型打败三个专家 懒人包:Google DeepMind 的 Vision Banana 用一个只会画图的模型,在分割、深度估计、表面法线三个基准上同时超过了 SAM 3、Depth Anything 3 和 Lotus-2。没改架构,只换了提示词。ResNet 发明人何恺明和 DiT 框架联合作者谢赛宁以 leadership sponsor 身份参与。同一天,群里爆发了一场关于 agent 系统到底能不能调试的争论,实测数字是 agent 任务收敛需要 50-150 轮复检,传统代码只要 3-5 轮。两件事指向同一个矛盾:LLM 让它强大的是概率性,让它难搞的也是概率性。 一个只会画图的模型,同时打败了三个领域专家 鸭哥昨天在 Vision Banana:生成即理解终于来到视觉领域 里拆了一篇 Google DeepMind 的新论文。论文做了一件反直觉的事:把语义分割、度量深度估计、表面法线估计全部重新定义为图片生成任务。...