[鸭哥 AI 手记] 2026-06-09: 通才配AI，压过领域专家

懒人包：Anthropic在Fable 5的安全报告里埋了一个稻瘟病防御实验。六位生物学博士分两组用同一个AI模型做任务，通用组里两支团队方案质量超过了所有领域专家团队。纯人工做同样的方案需要两到三个半月，AI辅助下两个人一天多搞定。这个实验暴露了一条正在移动的价值分界线：AI抹平了"知道得多"的信息差，却让另一类人——知道AI在哪里会出错、什么时候该停下来的人——更稀缺了。同一天，Fable 5公布定价：每百万输出token $50，两周后退出订阅改按用量计费。而Anthropic两个月前悄悄发布的advisor tool，恰好是高价下唯一算得过账的用法。

稻瘟病实验里那个没被对照的变量

鸭哥昨天在 Fable 5 的安全报告里埋着一个稻瘟病实验，暴露了谁才是绕不过去的人中拆了Anthropic 244页安全报告中的一段。六位生物学博士分成两组，一组配植物病理学专家，另一组配普通微生物学博士，所有人用Claude Mythos 5完成一个农业病原体防御设计任务，时限16小时。

通用组里两支团队方案质量超过全部专家团队。专家估算纯人工需要两到三个半月。AI辅助下两个人一天多搞定。

这个结果指向的方向不难理解：在"找答案"这件事上，AI的速度和覆盖面已经超过任何人类专家。文献检索、跨领域综合、已有数据上的排序优化，Mythos 5在这些维度可以直接打平甚至超越一个深耕多年的领域专家。

但实验里有一个细节，从头到尾没被对照。每个团队都配了一位LLM专家。这个人不写prompt。他知道模型会在哪里虚构引用、会在长会话里忘掉前面的约束、会高估方案可行性、明明检测到缺陷还是继续往下走。知道这些以后，他在这些位置收紧，发现不对就把模型拉回来。

这件事和群里胥克谦当天完成的170轮复检是同一个现象的不同版本。胥克谦的原话："终于过了，这个环节复检了170轮，每一轮都是多环节每个环节都是多agent并行。" Ethan蒋镒珍补了另一个角度："skill都写的清清楚楚的，但是一会儿能叫到，一会儿叫不到。上下文一旦污染了之后，LLM就是昏的。"

这些看起来是技术故障。但稻瘟病实验把它们重新框成了一个结构性问题：AI在做判断这件事上有可预测的失败模式。这些模式不会被更强的模型消除——Mythos 5已经是Anthropic最强的模型了——但可以被一个知道这些模式的人接住。

这就把AI时代"什么是稀缺"重新画了一遍。过去值钱的是领域知识，你懂稻瘟病别人不懂。AI正在把这件事拉平。已发表的知识检索得比谁都快，单个人的记忆和精力优势被抹掉。但它同时捅出了一个新缺口：它输出得越快的答案，越需要有人判断答案靠不靠得住。因为它会自信地犯错，把难的当容易的。领域知识的缺口是分散的，三百六十行各有一道门槛。会校准AI的人，他的能力跨行业——模型的毛病在各个领域长得差不多：过度乐观、编造数据、低估复杂度、不主动停下来。你在生物研究里练出来的校准直觉，换到法律文书和投资分析里一样管用。

领域专家不用全程在场，给几条关键反馈就够了，每次几句话。校准者不行，他得一直盯，每一轮输出都过眼。谁一直盯，谁就是那个绕不过去的人。

Anthropic把Fable 5的生物风险判定为CB-1级别，但明确写了这个判定"远不如以往模型清晰"。英国AISI在短暂的初步测试窗口内已经朝一个通用越狱取得进展。安全结论的承重点，压在了"那个会校准的人在不在场"上——和价值的逻辑是同一件事的两面。

鸭哥在群里举了一个校准的实时案例。他之前用GPT和DeepSeek写天文文案，两边都用了"秒差距"这个单位。他脑子里闪过一次"应该用光年大家才能看懂"。今天叫Fable改，Fable主动把秒差距换成光年了。他没说，模型自己就改了。

这件事反过来读更有信息量。Fable 5能主动发现并修正隐含假设里的错误。但"脑子里闪过应该用光年"这个判断动作，仍然是站在模型外面的人在做的。

两百年前的价格围栏，搬进了推理循环

鸭哥昨天在付 Fable 的价，拿 Opus 的货：AI 安全护栏的另一重身份里分析了Anthropic的定价设计。6月9日发布Fable 5/Mythos 5双轨，同时公布了一个30天内已经执行了五个动作的定价序列：5月13日通知订阅用户程序化调用将独立计费；5月28日Opus 4.8发布时把fast mode溢价从6倍降到2倍；6月1日机密提交S-1启动IPO；6月9日Fable 5双轨发布；6月15日credit拆分生效。6月23日Fable 5退出订阅。

核心结构是：Fable 5和Mythos 5是同一个底层模型。Mythos 5满血但只向约150家Glasswing合作伙伴开放（Anthropic官方公告）。Fable 5面向所有人，代价是每个请求都要过一遍安全classifier，碰到高危领域就把回答交给上一代Opus 4.8。官方说触发的session不到5%。这个classifier的算力成本比去掉它还高——受约束的版本，制造成本反而更高——恰好符合经济学家给damaged goods下的经典判据。

鸭哥把这条线和法国工程师Jules Dupuit在1849年提出的"价格围栏"概念接了起来。铁路公司不给三等车厢装顶棚，不是为了省木料钱，是让付得起二等票的人自己离开低价通道。航空公司的往返票含周六晚过夜才能打折——度假的人本来跨周末，出差的人只好买全价票。围栏的精髓是自选择。

Anthropic的安全classifier把围栏从价目表搬进了推理循环。航空公司只在订票那一刻筛一次人；classifier在每一次调用的瞬间重新分一次箱。Fable还是Mythos级的能力，由模型在毫秒级决定。需要满血网络安全能力的组织恰好就是能签企业合同、能过审查、能接受30天数据保留条款的组织。信任和支付意愿在AI市场上接近同一个变量。

群里的反应恰好验证了围栏的效果。鸭哥说"还是没控制住充了claude code usage credit，只舍得开了一个fable session，然后就看到余额光速跳水"。谷雨说五小时quota转眼用完。郝越在原话里精准描述了Anthropic预设的用户行为："给你试用下，让你上瘾。你现在用了12天fable，23号回到opus，你会感到浑身不舒服，就想充钱。"

Fable 5定价每百万输入token $10、输出$50，Opus 4.8的两倍（CNBC报道）。社区测算订阅用户的实际用量被砍了12到175倍。HN热帖（1146分，948条评论）中最高赞评论直指"先送后撤"策略令用户不安。Reddit上有用户报告Fable 5以约2%/分钟的速度消耗Max计划额度：一次40分钟的agent会话用掉每周用量的16%。

但鸭哥在 Fable 5 很贵，但省钱的答案 Anthropic 两个月前就发布了中指出，省钱方案已经在了。4月9日上线的advisor tool让Sonnet 4.6干活、Opus 4.8当顾问。Sonnet单跑SWE-bench Multilingual 72.1%，加上Opus advisor到74.8%，单任务成本反而低11.9%。好的计划减少了试错回合，顾问身上多花的钱被省下来的执行回合补了回来。

这个模式和AgentOpt论文的关键结论形成了一种看上去矛盾、实际上一致的对称。AgentOpt发现强模型做planner不行，因为它不守角色边界——九次实验里有七次跳过对下游solver的工具调用，自己直接答了。弱模型反而合格，因为它清楚自己答不上来，老老实实调工具。真正的变量不是哪个模型更会规划，是握着控制循环的模型会不会越界。advisor tool恰好把这个风险从源头上去掉：Opus的智能还在，工具被收走，控制权被收走，只能以建议文本的形式注入回路，想越界也没有手段。

鸭哥在群里的一句话把两件事连了起来："fable 5确实比gpt 5.5好。我做科学计算模拟，5.5调了一上午，fable 5看了一眼框框就改好了。主要不是coding本身，是算法正确性。"

两篇文章指向同一个判断：AI的能力在变强，强到新的瓶颈开始从"模型不够好"转移到"控制和校准层不够厚"。稻瘟病实验里那个缺不了的LLM专家，Anthropic定价体系里作为护栏和围栏同一装置的classifier，advisor tool里权责分离的架构，Siri防误唤醒史上从notch filter到声学指纹到水印的层层叠加——都在说同一件事。开放信道需要控制层。信道越宽，控制层越值钱。

也值得知道

Siri防误唤醒背后的十年攻防：鸭哥昨天发布的 Siri 的频段缺口，和一条从 Xbox 开始的工程族谱梳理了从2014年Aaron Paul Xbox广告误触发，到汉堡王故意用广告唤醒用户Google Home，再到WWDC26苹果在直播音轨里削掉Siri唤醒词所在频段的工程演进。语音交互天生是开放信道，和AI输出的"开放性"形成了同一个模式的镜像。

微软供应链攻击波及AI开发者：6月5日Miasma蠕虫通过入侵微软贡献者账户将恶意代码注入73个开源仓库，受影响包包括Azure SDK组件和Claude Code、Gemini CLI相关工具。这是首起直接针对AI编码工具链的大规模供应链攻击（TechCrunch）。

DeepSeek首轮外部融资3亿美元以上：国家大基金领投，腾讯和阿里在洽谈参投，估值超100亿美元。DeepSeek同时对V4-Pro API降价75%，与Anthropic Fable 5定价方向正好相反（StartupHub）。

本期素材来自 AI Builder Space 社群讨论与公开 AI 行业信息的交叉验证。

本文由AI综合领域调研和微信群聊自动生成。请注意甄别幻觉。

订阅本 newsletter：daily.yage.ai

鸭哥每日AI要闻

[鸭哥 AI 手记] 2026-06-09: 通才配AI，压过领域专家

[鸭哥 AI 手记] 2026-06-09: 通才配AI，压过领域专家

稻瘟病实验里那个没被对照的变量

两百年前的价格围栏，搬进了推理循环

也值得知道

[鸭哥 AI 手记] 2026-06-11: Fable 5 暗中降智被曝光，36 小时道歉

[鸭哥 AI 手记] 2026-06-10: Lovable 14个月从0做到4亿美元

[鸭哥 AI 手记] 2026-06-08: 何恺明新作：画图模型打败三个专家