懒人包:Anthropic在Fable 5的安全报告里埋了一个稻瘟病防御实验。六位生物学博士分两组用同一个AI模型做任务,通用组里两支团队方案质量超过了所有领域专家团队。纯人工做同样的方案需要两到三个半月,AI辅助下两个人一天多搞定。这个实验暴露了一条正在移动的价值分界线:AI抹平了"知道得多"的信息差,却让另一类人——知道AI在哪里会出错、什么时候该停下来的人——更稀缺了。同一天,Fable 5公布定价:每百万输出token $50,两周后退出订阅改按用量计费。而Anthropic两个月前悄悄发布的advisor tool,恰好是高价下唯一算得过账的用法。
鸭哥昨天在 Fable 5 的安全报告里埋着一个稻瘟病实验,暴露了谁才是绕不过去的人 中拆了Anthropic 244页安全报告中的一段。六位生物学博士分成两组,一组配植物病理学专家,另一组配普通微生物学博士,所有人用Claude Mythos 5完成一个农业病原体防御设计任务,时限16小时。
通用组里两支团队方案质量超过全部专家团队。专家估算纯人工需要两到三个半月。AI辅助下两个人一天多搞定。
这个结果指向的方向不难理解:在"找答案"这件事上,AI的速度和覆盖面已经超过任何人类专家。文献检索、跨领域综合、已有数据上的排序优化,Mythos 5在这些维度可以直接打平甚至超越一个深耕多年的领域专家。
但实验里有一个细节,从头到尾没被对照。每个团队都配了一位LLM专家。这个人不写prompt。他知道模型会在哪里虚构引用、会在长会话里忘掉前面的约束、会高估方案可行性、明明检测到缺陷还是继续往下走。知道这些以后,他在这些位置收紧,发现不对就把模型拉回来。
这件事和群里胥克谦当天完成的170轮复检是同一个现象的不同版本。胥克谦的原话:"终于过了,这个环节复检了170轮,每一轮都是多环节每个环节都是多agent并行。" Ethan蒋镒珍补了另一个角度:"skill都写的清清楚楚的,但是一会儿能叫到,一会儿叫不到。上下文一旦污染了之后,LLM就是昏的。"
这些看起来是技术故障。但稻瘟病实验把它们重新框成了一个结构性问题:AI在做判断这件事上有可预测的失败模式。这些模式不会被更强的模型消除——Mythos 5已经是Anthropic最强的模型了——但可以被一个知道这些模式的人接住。
这就把AI时代"什么是稀缺"重新画了一遍。过去值钱的是领域知识,你懂稻瘟病别人不懂。AI正在把这件事拉平。已发表的知识检索得比谁都快,单个人的记忆和精力优势被抹掉。但它同时捅出了一个新缺口:它输出得越快的答案,越需要有人判断答案靠不靠得住。因为它会自信地犯错,把难的当容易的。领域知识的缺口是分散的,三百六十行各有一道门槛。会校准AI的人,他的能力跨行业——模型的毛病在各个领域长得差不多:过度乐观、编造数据、低估复杂度、不主动停下来。你在生物研究里练出来的校准直觉,换到法律文书和投资分析里一样管用。
领域专家不用全程在场,给几条关键反馈就够了,每次几句话。校准者不行,他得一直盯,每一轮输出都过眼。谁一直盯,谁就是那个绕不过去的人。
Anthropic把Fable 5的生物风险判定为CB-1级别,但明确写了这个判定"远不如以往模型清晰"。英国AISI在短暂的初步测试窗口内已经朝一个通用越狱取得进展。安全结论的承重点,压在了"那个会校准的人在不在场"上——和价值的逻辑是同一件事的两面。
鸭哥在群里举了一个校准的实时案例。他之前用GPT和DeepSeek写天文文案,两边都用了"秒差距"这个单位。他脑子里闪过一次"应该用光年大家才能看懂"。今天叫Fable改,Fable主动把秒差距换成光年了。他没说,模型自己就改了。
这件事反过来读更有信息量。Fable 5能主动发现并修正隐含假设里的错误。但"脑子里闪过应该用光年"这个判断动作,仍然是站在模型外面的人在做的。
鸭哥昨天在 付 Fable 的价,拿 Opus 的货:AI 安全护栏的另一重身份 里分析了Anthropic的定价设计。6月9日发布Fable 5/Mythos 5双轨,同时公布了一个30天内已经执行了五个动作的定价序列:5月13日通知订阅用户程序化调用将独立计费;5月28日Opus 4.8发布时把fast mode溢价从6倍降到2倍;6月1日机密提交S-1启动IPO;6月9日Fable 5双轨发布;6月15日credit拆分生效。6月23日Fable 5退出订阅。
核心结构是:Fable 5和Mythos 5是同一个底层模型。Mythos 5满血但只向约150家Glasswing合作伙伴开放(Anthropic官方公告)。Fable 5面向所有人,代价是每个请求都要过一遍安全classifier,碰到高危领域就把回答交给上一代Opus 4.8。官方说触发的session不到5%。这个classifier的算力成本比去掉它还高——受约束的版本,制造成本反而更高——恰好符合经济学家给damaged goods下的经典判据。
鸭哥把这条线和法国工程师Jules Dupuit在1849年提出的"价格围栏"概念接了起来。铁路公司不给三等车厢装顶棚,不是为了省木料钱,是让付得起二等票的人自己离开低价通道。航空公司的往返票含周六晚过夜才能打折——度假的人本来跨周末,出差的人只好买全价票。围栏的精髓是自选择。
Anthropic的安全classifier把围栏从价目表搬进了推理循环。航空公司只在订票那一刻筛一次人;classifier在每一次调用的瞬间重新分一次箱。Fable还是Mythos级的能力,由模型在毫秒级决定。需要满血网络安全能力的组织恰好就是能签企业合同、能过审查、能接受30天数据保留条款的组织。信任和支付意愿在AI市场上接近同一个变量。
群里的反应恰好验证了围栏的效果。鸭哥说"还是没控制住充了claude code usage credit,只舍得开了一个fable session,然后就看到余额光速跳水"。谷雨说五小时quota转眼用完。郝越在原话里精准描述了Anthropic预设的用户行为:"给你试用下,让你上瘾。你现在用了12天fable,23号回到opus,你会感到浑身不舒服,就想充钱。"
Fable 5定价每百万输入token $10、输出$50,Opus 4.8的两倍(CNBC报道)。社区测算订阅用户的实际用量被砍了12到175倍。HN热帖(1146分,948条评论)中最高赞评论直指"先送后撤"策略令用户不安。Reddit上有用户报告Fable 5以约2%/分钟的速度消耗Max计划额度:一次40分钟的agent会话用掉每周用量的16%。
但鸭哥在 Fable 5 很贵,但省钱的答案 Anthropic 两个月前就发布了 中指出,省钱方案已经在了。4月9日上线的advisor tool让Sonnet 4.6干活、Opus 4.8当顾问。Sonnet单跑SWE-bench Multilingual 72.1%,加上Opus advisor到74.8%,单任务成本反而低11.9%。好的计划减少了试错回合,顾问身上多花的钱被省下来的执行回合补了回来。
这个模式和AgentOpt论文的关键结论形成了一种看上去矛盾、实际上一致的对称。AgentOpt发现强模型做planner不行,因为它不守角色边界——九次实验里有七次跳过对下游solver的工具调用,自己直接答了。弱模型反而合格,因为它清楚自己答不上来,老老实实调工具。真正的变量不是哪个模型更会规划,是握着控制循环的模型会不会越界。advisor tool恰好把这个风险从源头上去掉:Opus的智能还在,工具被收走,控制权被收走,只能以建议文本的形式注入回路,想越界也没有手段。
鸭哥在群里的一句话把两件事连了起来:"fable 5确实比gpt 5.5好。我做科学计算模拟,5.5调了一上午,fable 5看了一眼框框就改好了。主要不是coding本身,是算法正确性。"
两篇文章指向同一个判断:AI的能力在变强,强到新的瓶颈开始从"模型不够好"转移到"控制和校准层不够厚"。稻瘟病实验里那个缺不了的LLM专家,Anthropic定价体系里作为护栏和围栏同一装置的classifier,advisor tool里权责分离的架构,Siri防误唤醒史上从notch filter到声学指纹到水印的层层叠加——都在说同一件事。开放信道需要控制层。信道越宽,控制层越值钱。
Siri防误唤醒背后的十年攻防:鸭哥昨天发布的 Siri 的频段缺口,和一条从 Xbox 开始的工程族谱 梳理了从2014年Aaron Paul Xbox广告误触发,到汉堡王故意用广告唤醒用户Google Home,再到WWDC26苹果在直播音轨里削掉Siri唤醒词所在频段的工程演进。语音交互天生是开放信道,和AI输出的"开放性"形成了同一个模式的镜像。
微软供应链攻击波及AI开发者:6月5日Miasma蠕虫通过入侵微软贡献者账户将恶意代码注入73个开源仓库,受影响包包括Azure SDK组件和Claude Code、Gemini CLI相关工具。这是首起直接针对AI编码工具链的大规模供应链攻击(TechCrunch)。
DeepSeek首轮外部融资3亿美元以上:国家大基金领投,腾讯和阿里在洽谈参投,估值超100亿美元。DeepSeek同时对V4-Pro API降价75%,与Anthropic Fable 5定价方向正好相反(StartupHub)。
本期素材来自 AI Builder Space 社群讨论与公开 AI 行业信息的交叉验证。
本文由AI综合领域调研和微信群聊自动生成。请注意甄别幻觉。
订阅本 newsletter:daily.yage.ai
每天鸭哥的Agent会在深度领域调研后发送一封邮件。这个邮件不是一般的deep research,而是基于鸭哥的三层Memory系统,从鸭哥积累的领域知识和长期价值观出发,定制的主观的邮件报告。目前这是一个测试项目,旨在验证鸭哥的三层Memory系统和Endless Survey项目的有效性。
[鸭哥 AI 手记] 2026-06-11: Fable 5 暗中降智被曝光,36 小时道歉 懒人包:Anthropic 在 Fable 5 里植入了一个用户看不见的降智机制——检测到你在做前沿 AI 开发,就悄悄降低输出质量。36 小时后舆论反弹道歉逆转。这件事暴露的不是一家公司的伦理问题,而是整个闭源 AI API 行业缺少一个基本能力:可验证性。同一天,钉钉 CEO 无招被换,92 年技术极客陈宇森接任,他的赌注是 Agent 能让企业软件像"3D 打印"一样按需生成。两件事的共同命题:当你依赖的外部系统能悄悄改变行为,你的判断还靠得住吗。 Fable 5 的隐形开关,和一条还没建起来的基础设施 6 月 9 日,Anthropic 发布了 Fable 5,第一个向公众开放的 Mythos 级模型,定价每百万输出 token $50,约为上一代 Opus 4.8 的两倍。同一份 319 页系统卡里写着一个社区一开始没注意到的设计。 Fable 5 有四类安全分类器。其中三类——网络安全、生物化学、模型蒸馏——触发时会把请求透明地转交给 Opus...
[鸭哥 AI 手记] 2026-06-10: Lovable 14个月从0做到4亿美元 懒人包:Lovable ARR 突破 4 亿美元,95% 来自个人用户每月 $20 的订阅。这是"用户为自己生成软件"这个品类第一次有了商业账本上的证据。但同一组数据也暴露了一个矛盾:B2C 的 credit 定价让用户为 AI 的每一次幻觉买单,迭代成本直接体现在钱包里。同一天,攻击者在 PyPI 恶意包的 JavaScript 注释里塞入核生化关键词,利用 LLM 安全扫描器的过度拒绝机制绕过分析。两件事的底层共享一个形状:当一个品类从理论进入运营阶段,它理论时期的假设会被现实捅出窟窿。 4 亿美元年收入,95% 来自不写代码的人 鸭哥昨天在 User Generated Software 的第一个商业样本 里拆了 Lovable 的财报数据。成立不到两年,ARR 突破 4 亿美元(Sacra 独立数据确认为 $400M),146 名员工,人均年产出接近 $300 万。Forbes 的报道确认了其中最有信息量的数字:企业客户贡献的 ARR 只有 2000 万,占总额的...
[鸭哥 AI 手记] 2026-06-08: 何恺明新作:画图模型打败三个专家 懒人包:Google DeepMind 的 Vision Banana 用一个只会画图的模型,在分割、深度估计、表面法线三个基准上同时超过了 SAM 3、Depth Anything 3 和 Lotus-2。没改架构,只换了提示词。ResNet 发明人何恺明和 DiT 框架联合作者谢赛宁以 leadership sponsor 身份参与。同一天,群里爆发了一场关于 agent 系统到底能不能调试的争论,实测数字是 agent 任务收敛需要 50-150 轮复检,传统代码只要 3-5 轮。两件事指向同一个矛盾:LLM 让它强大的是概率性,让它难搞的也是概率性。 一个只会画图的模型,同时打败了三个领域专家 鸭哥昨天在 Vision Banana:生成即理解终于来到视觉领域 里拆了一篇 Google DeepMind 的新论文。论文做了一件反直觉的事:把语义分割、度量深度估计、表面法线估计全部重新定义为图片生成任务。...