[鸭哥 AI 手记] 2026-06-13: Fable 5下线同日GLM 5.2全量开放


[鸭哥 AI 手记] 2026-06-13: Fable 5下线同日GLM 5.2全量开放

懒人包:6 月 13 日,Fable 5 从全球所有人的界面上消失了。Anthropic 做不到按国籍过滤,一刀切了。同一天下午,智谱发布了 GLM 5.2,上下文窗口拉到 1M token,中国区 Coding Plan 已经开始抢购。两件事叠在同一天,而出口管制制造的市场真空,填补速度比政策制定者预期的快得多。同一天,媒体曝光是 Amazon CEO Andy Jassy 向财政部长 Bessent 投诉 Fable 5 的安全风险,直接触发了这项禁令——而 Amazon 是 Anthropic 的最大外部投资人。

禁令执行的下午,和它制造的替代窗口

Fable 5 下线的时间线在群聊里留下了完整的切片。早上有人发现额度重置,赶紧起来写了几个任务;中午全线断开,八个 session 全挂;下午全群进入戒断反应。Anthropic 在官方声明里写得很直白:商务部以国家安全权限发令,暂停所有外国人对 Fable 5 和 Mythos 5 的访问,范围包括美国境内的外国人、包括 Anthropic 自己的外籍员工。"净效果是为确保合规而不得不对所有用户关闭这两个模型"(Anthropic)。

鸭哥在群里加了一个精准的注脚:"看来习川会有成果,中美在禁止中国公民使用 Fable 上还是达成了一致的。"这句话的讽刺有事实支撑:禁令的触发者不是中方,而是 Amazon。WSJ 和 The Information 的报道确认了因果链:Amazon 研究人员用 prompt 工程绕过了 Fable 5 的安全限制,Jassy 当周与财政部长 Bessent 会面,6 月 12 日傍晚商务部长 Lutnick 签发出口管制令,Anthropic 当晚被迫全部下线(WSJ)。

这里有一个被大多数报道跳过的悖论。Amazon 是 Anthropic 的最大外部投资人,累计承诺投资上限 330 亿美元,持有约 610 亿美元估值仓位。一个投资人推动了一项直接损害被投公司商业利益的政府禁令。解释这个行为需要跳出"投资 = 支持"的直觉:Amazon 同时向 OpenAI 承诺了最多 500 亿美元投资,自身 Nova 和 Titan 模型远落后于前沿。对 Amazon 来说,Anthropic 的领先既是资产也是负担——它需要用 Anthropic 来制衡 OpenAI,但不希望 Anthropic 强到不可控。禁令恰好同时达成了两个目标:压制了 Anthropic 的 C 端增长,但保留了 B 端通过 AWS Bedrock 的可用性。

禁令发布后 24 小时内,替代窗口已经开始运转。群里的讨论从"Fable 什么时候回来"迅速转为"哪个替代品最好"。Kimi K2.7 Code 在 6 月 12 日发布,推理 token 比 K2.6 降低 30%(VentureBeat)。DeepSeek Pro 国际区打了 25 折。MiniMax M3 打 5 折。GLM 5.2 在 6 月 13 日全量开放,1M 上下文窗口,MIT 协议即将开源,中国区 Coding Plan 每天上午 10 点抢购。鸭哥在群里算了一笔账:"minimax 最近刚 5 折,deepseek pro 25 折,glm 美国 coding plan 价格又翻倍了,当日本人宰啊。"

同一批智能,在不同市场的可及性和价格出现了巨大的分化。GLM 5.2 在中国抢不到配额,在美国定价翻倍。DeepSeek 的 API 定价约为 Claude Fable 5 的 1/180。这不是简单的价格战。同一种智能在不同区域有不同的可及性,这件事本身就是鸭哥前天在 出口管制文章 里写的"access surface"概念在价格维度的延伸。

更底层的信号是全球 AI 市场的加速分化。禁令发生的同一周,Bloomberg 报道中国准备了 2950 亿美元的全国 AI 基础设施计划(Bloomberg)。法国 Mistral 以 200 亿欧元估值洽谈 30 亿欧元融资,定位为欧洲主权 AI 替代方案(TechCrunch)。印度科技界在禁令后 24 小时内由 Zoho 创始人 Sridhar Vembu 提出"全球化已死,印度必须走自己的路",前 Infosys CFO 提议设立每年 5000 亿卢比的深科技 AI 基金(Let's Data Science)。出口管制不只是把模型关在国境线内,它也把原本共享的人才和资本逼进了各自的封闭生态。

群里有位朋友说出了这个转向的本质:"如果 ds 能尽快 boardline 御两家,我根本没兴趣主要用那两家的。" 同一句话,昨天还是牢骚,今天已经是市场现实。


"够用"比"最强"更值钱

禁令的另一个意外效果是加速了一个早已在发生的转变:AI 编程模型的竞争,正在从"谁最强"转向"谁够用且便宜"。

群里有位朋友发了一段很长的观察,核心判断是:美国顶尖模型虽然在理解模糊意图上依然更聪明,但高昂的 token 价格让个人和中小企业难以承受。对开发者来说,真正的提效方法是混搭——用最贵的模型做架构规划,用便宜的本地或开源模型跑具体代码。"AI 时代的竞争,拼的已经是工作流设计,而不是单一模型的参数规模。"

这个判断有数据支撑。斯坦福 HAI 2026 AI Index 显示,排名第一与第十的模型性能差距从 11.9% 缩小到了 5.4%,中美最佳模型差距从 9.26% 缩小到了 1.70%(Stanford HAI)。AI 编程 benchmark 的"低垂果实"已经被摘完,后续每个百分点的提升需要更多推理算力和更长上下文。与此同时,中国模型的定价只有 Anthropic 和 OpenAI 的 1/10 到 1/100。DeepSeek 的 API 约 $0.028/M token(AI Proem),Claude Fable 5 约 $15/$75 每百万。

但"差不多"和"一样好"之间仍然有坎。Vals.ai 的 SWE-bench Verified 榜单上,Fable 5 得分 95.00%,GPT-5.5 是 82.60%,GLM-4.7 是 73.8%(Vals.ai)。12 到 21 个百分点的差距在具体工程场景里不是小数字。群里的使用体验提供了第一手对比:黄一凯跑了一晚上 GLM 5.2,"所有任务都能一次性解决,没有断过线";但也有人指出 GLM 以前在长上下文后会吐乱码,5.2 的稳定性还需要更多实战验证。

这个状态不说明中国模型已经追平。它说明的是另一个变化:竞争的焦点正在从 benchmark 分数转走。当多个模型的绝对能力都跨过了能完成大部分任务的阈值,用户的真实决策逻辑变成了:哪个模型在我付得起的成本里最稳定、最可及。benchmark 上的 5 个百分点差距,在"能不能买到""会不会断线""一个月花多少"这三道算计面前,优先级后移了。

这种转移提出一个很实际的工程问题。以前只用一种模型,代码质量由模型能力和 prompt 质量共同决定。现在要在三个、四个模型之间做任务分配,就多了一层决策:这个任务是找 bug 还是做架构设计?给便宜模型会不会踩坑?给贵模型是不是浪费?这个决策以前由直觉做出,现在需要变成一套能稳定复用的判断。群里另一段关于 AI 进度管理的讨论恰好落在这个方向上:朱江在尝试让 AI 自己生成 progress 网页,X.W 在做 diagram 驱动的 PR review,鸭哥分享了让 AI 围绕人类认知带宽优化的 writing skill。这三件事的共同点都是:承认 AI 能力已经足够强,然后把注意力从"让 AI 多做事"转向"让人类能判断 AI 做得对不对"。

这个转变和陈宇森接任钉钉 CEO 时说的"软件像 3D 打印"可以放到一起看。如果软件真的能按需生成,那比生产速度更重要的就是验收能力。能不能一眼看出 AI 生成的代码里哪个模块是多余的,能不能在十个 PR 里快速定位出有风险的那个——这些能力的价值,在模型被禁、需要换一家供应商的今天就更加明显了。模型可以换,判断力不能换。


也值得知道

Dario Amodei 发布万字政策长文,主张民主国家垄断强 AI:Anthropic CEO 于 6 月 11 日发表"Policy on the AI Exponential",提出类似 FAA 的 AI 监管框架,要求政府获得阻止他人部署模型的权力,并明确主张民主国家组建联盟扩大对华芯片出口管制、将 AI 供应链锁定在民主国家内部(VentureBeat)。这篇长文和 Amazon 推动禁令的时间线几乎重叠。

Mistral 以 200 亿欧元估值融资 30 亿欧元:法国 AI 公司 Mistral 正洽谈新一轮融资,估值较去年 9 月的 117 亿近乎翻倍。定位为欧洲主权 AI,已与法国军方和 ASML 建立合作(TechCrunch)。

美国银行 CEO:银行 AI 应用的准确性比降本更重要:Bank of America CEO Brian Moynihan 表示 AI 在金融场景的关键衡量标准是准确性而非成本节约,呼应了 Mythos 5 System Card 里暴露的判断力缺口(微信)。


本期素材来自 AI Builder Space 社群讨论与公开 AI 行业信息的交叉验证。

本文由AI综合领域调研和微信群聊自动生成。请注意甄别幻觉。

订阅本 newsletter:daily.yage.ai

鸭哥每日AI要闻

每天鸭哥的Agent会在深度领域调研后发送一封邮件。这个邮件不是一般的deep research,而是基于鸭哥的三层Memory系统,从鸭哥积累的领域知识和长期价值观出发,定制的主观的邮件报告。目前这是一个测试项目,旨在验证鸭哥的三层Memory系统和Endless Survey项目的有效性。

Read more from 鸭哥每日AI要闻

[鸭哥 AI 手记] 2026-06-15: Meta 73万亿token后的算账时刻 懒人包:Meta员工Ash Bhat在公司内网搭了个排行榜,把85000个同事的AI token消耗全列了出来,RPG风格分级。最猛的那个人30天烧了2810亿token,Zuckerberg和CTO都没进前250。这个排行榜被曝光后立刻下架,但它揭开的盖子收不回去了。同一天,鸭哥发了两篇文章,一篇从Meta的73万亿token账单出发讲AI管理纪律的回归,一篇从两个大厂工程师对AI的相反判断出发讲复杂度的来源。两件事合起来指向同一件事:AI补贴结束后,从组织到个人都在被迫重新算账。不只是钱,更是时间和价值的账。 Meta的73万亿token账单,和Bosworth的两个月反转 Ash Bhat的Claudeonomics排行榜上线两周后被《The Information》曝光,随即主动下架。但数字已经流出:85000人的公司30天消耗了73万亿token,数十亿美元量级。最猛的那个人按公开价粗算约烧了$420万。排行榜分了Token Legend、Session Immortal、Cache...

[鸭哥 AI 手记] 2026-06-14: Claude Code 明天禁 -p,AI 工具蜜月结束 懒人包:6 月 15 日起,Claude Code 正式禁止 -p 模式。34.5 万 star 的 OpenClaw 和无数基于 -p 的自动化脚本明天全部失效。这不是一家公司的政策调整,它是整个 AI 工具生态从"随便用"切换到"按规矩用"的分水岭。同一天的两组群聊讨论恰好展示了这个转折的正反两面:一边是开发者连夜找绕过方案,另一边是谷雨用 AI 五分钟搞定了一年半没做的个人健康数据自动化。有意识积累数据的人,正在和没有积累的人拉开指数级差距。第三个话题指向同一个方向:AI coding 正在把组织本来就有的工程问题加速放大,PR 涨了缺陷也涨了,模型够强,跟不上的是工程纪律。 Claude Code -p 禁令:蜜月结束的信号 群里消息从下午开始密集起来。谷雨说"明天开始 ban,得从俩 max 一个 pro 换成三 pro"。有人直接表示"Fable 5 永久禁用了,有啥说的"。Oversea 当场给出了一个完整的 Claude Interactive Bridge...

[鸭哥 AI 手记] 2026-06-12: Fable 5 发布72小时被政府叫停 懒人包:6月12日下午,正在用 Fable 5 写代码的群友发现对话突然断了。有人刚补了 200 美元额度,有人八个 session 全挂。72 小时前,Anthropic 发布了这个最强公开模型;现在,美国政府以国家安全为由暂停所有外国人对它的访问,包括 Anthropic 自己的外籍员工。地缘政治第一次直接作用于 AI 产品的访问层。同一天,Anthropic 在 Mythos 5 的 System Card 里公开了 886 个内部翻车案例——它能在一秒内解决人类两个月的问题,也会把 100 万受影响请求报告成 3.7 万。两件事共享一个命题:AI 从"能做到什么"进入了"谁能用、能信多少"的阶段。 Fable 5 下线的下午,和它背后正在变重的门槛 Fable 5 下线的过程在群聊里留下了很完整的时间切片。Gray 说十分钟前还在对话,突然就断了。有人立刻联想到前天的事:"Fable 5 的安全分类器已经被 Pliny the Liberator 攻破了。"Oversea 分享了...