[鸭哥 AI 手记] 2026-06-14: Claude Code 明天禁 -p,AI 工具蜜月结束


[鸭哥 AI 手记] 2026-06-14: Claude Code 明天禁 -p,AI 工具蜜月结束

懒人包:6 月 15 日起,Claude Code 正式禁止 -p 模式。34.5 万 star 的 OpenClaw 和无数基于 -p 的自动化脚本明天全部失效。这不是一家公司的政策调整,它是整个 AI 工具生态从"随便用"切换到"按规矩用"的分水岭。同一天的两组群聊讨论恰好展示了这个转折的正反两面:一边是开发者连夜找绕过方案,另一边是谷雨用 AI 五分钟搞定了一年半没做的个人健康数据自动化。有意识积累数据的人,正在和没有积累的人拉开指数级差距。第三个话题指向同一个方向:AI coding 正在把组织本来就有的工程问题加速放大,PR 涨了缺陷也涨了,模型够强,跟不上的是工程纪律。

Claude Code -p 禁令:蜜月结束的信号

群里消息从下午开始密集起来。谷雨说"明天开始 ban,得从俩 max 一个 pro 换成三 pro"。有人直接表示"Fable 5 永久禁用了,有啥说的"。Oversea 当场给出了一个完整的 Claude Interactive Bridge 方案:不走 claude -p,把文本注入 tmux 终端 stdin,再从 JSONL 日志和终端缓冲区判断 agent 状态。

这个方案的工程量不低,但它暴露了一个更基本的转变。-p 本质上是把消费者订阅当成生产级 API 来用的灰色通道。Anthropic 的替代方案叫 Programmatic Credits:订阅费等值的 API 额度,配合 Agent SDK 和 Managed Agents。意思很明确:想在生产环境用,按 API 价格付钱,而不是靠 200 美元月费撑起全天候运行的 agent。

这不是 Anthropic 一家的事。过去两年,AI 工具的开发者生态大规模建立在消费者产品的使用漏洞上。OpenClaw 有 34.5 万 GitHub star,大量 CI/CD 脚本和个人自动化都依赖 claude -p。但历史上没有哪个平台封杀 API 后,第三方工具能成功转型到付费模式:Tweetbot 和 Apollo 都直接关停了。区别在于 Anthropic 给了一条过渡路径,尽管这条路径会让重度用户的实际可用额度大幅缩水。

鸭哥在群里有句吐槽精准地描述了这种模式强撑时的体验:"Opus 4.8 用的也骂娘,感觉一半是 Claude Code remote control 的锅。"当时 remote controlled session 没法用 /command 导致不能手动 compact,"踢一脚动一下,骂几句有点效果,然后在那磨洋工"。这不是偶然故障,而是一个设计选择正在显现其后果:当平台决心收紧权限,建在它上面的便捷方案会从各处开始漏风。

这件事的后果超越了 Claude Code 的用户圈。它重新画了一条线:API-first 的架构在平台收网时能活下来,依赖消费者产品漏洞的工作流会被迫重构。谷雨已经在考虑把 Codex 用作底层 provider,"任何新的 feature 直接就可以用"。同一时间,Anthropic 和 OpenAI 双双在 6 月初秘密提交 IPO(Reuters)。从 -p 禁令到出口管制到 IPO 准备,这一系列动作放在一起看比单看任何一件都更有解释力。


五分钟和一年半:个人 AI 落地的真正分界线

谷雨讲了一个很小的个人胜利。他一直想把 Garmin 健康数据和日历结合起来做行为分析:心率、压力、健身记录对照日程表上的事件,看哪些活动在消耗他。这件事"说了一年半一直没做,因为感觉 Garmin 连接起来比较麻烦"。今天下午终于动了手,让 AI 找了个库,"大概前后五分钟就连好所有数据了"。现在他每天自动抓取数据,和日历整合后生成日报和周报,"完全 ambient 了"。

五分钟。一年半。差距不在模型能力,在数据准备。谷雨说得很明白:"我日常里有意思的 curated 了这些 context:健康数据、calendar、每天录音、每天邮件、每天的总结。"这不是他今天才做的,是过去几年日常积累下来的。AI 到来之后,这些积压的 context 从"存在但没用上"变成了"五分钟搞定"。

同一天另一组讨论提供了这枚硬币的反面。王宏亮说他用过飞书妙计、科大讯飞听见、钉钉听记,"都花过钱",录了 200 多场会议,但"过了那天基本上从来没查过,目前没有一次检索和使用它"。他做了一个比抱怨更有信息量的自问:"我是否可以理解这个内容其实可有可无,只是产品设计出来的一种所谓的存在感。"

这两个极端之间是 Cat Chen 的观察。他说"ChatGPT 曾经有 Health 的 beta,也是从 Apple Health 获取数据,但 waitlist 了这么久估计官方早就放弃了。Perplexity 同样在做这样的产品,但它的 Apple Health integration 还没有做出来。这是每一家都想到了的产品,就是没人能做好。"

没人能做好,症结不在技术。健康数据的 API 接入正在全面收紧。Google Fit 退役转向 Health Connect,Garmin 暂停所有新 API 申请,Apple Health 需要走 EHR 合作方才可能签 BAA。大厂的 personal agent 产品跑不出来,症结在于数据获取本身就不再是纯技术问题,demo 能做出来但没法规模化上线。调研数据显示 2025 年有 3800 多家 agent 创业公司关闭,70% 的通用型 agent 从未进入实际使用。

谷雨能五分钟搞定,因为他走了一条和大厂产品完全不同的路:自己积累数据,自己控制接入。Chao 在群里接了一句类似的实践:因为出行多,他把 flighty、awaybook、滴滴、12306、GPS "一切信息合体,能知道我在地球上任意时间的坐标了"。这不是在等某个产品上线,是自己用 AI 把散落数据串成可用的基础设施。


AI coding 的组织物理:速度上升了,质量没有

linhow 在群里写了一段观察,核心判断很清晰:"对靠人海战术+疲劳加班+长周期蹂躏勉强交付的软件工程,AI 不是救星,而是加速崩溃的催化剂。"他的论据链很清楚:AI 缩短了软件反馈周期、扩大了软件规模,但"每周上线的 PR 数量大幅增加之后,每次上线的缺陷数量总数也增加了,靠时间和灰度消化不了这么多缺陷。"

这个判断有精确的数据做背板。CodeRabbit 基于 470 个开源 PR 的分析显示,AI 辅助的 PR 平均含 10.83 个问题,纯人工 PR 只有 6.45 个。安全漏洞是人工代码的 2.74 倍,可读性问题超过 3 倍(CodeRabbit)。DORA 2025 报告给出了一样的定性结论:AI 是放大器,好的工程团队更好,差的工程团队更差(DORA)。

IQ75 从经济角度补了一刀。"AI 万能派会假设 token 无限,AI coding 单次有 80% 的概率能做对,同样的问题让 AI 做 3 次,成功率就是 99.2%。听起来很美妙。"但他的结论更冷静:AI 暴力试错十几二十轮、消耗 1B token 才能解一个简单需求,"就连微软都做不到不计成本不限量供应 token 开发代码"。

token 成本的实际数字差异很大。StrongDM 每个工程师每天消耗约 $1,000,三个月烧掉约 200 万美元。微软自己的账单更温和,每月约 $2,000。关键变量不是单价,是重试次数。推理成本每六个月折半,但如果重试次数跟着翻倍,总成本不降反升。

这条规律已经在组织层面兑现。Jellyfish 调查了 600 多位工程领导者,PR 产出同比增 20%,但每 PR 关联的生产事故增加了 23.5%。交付变快了,稳定性变差了。AI 没有制造这些缺陷,它只是让原来就在那里的工程问题暴露得更快、更痛。

群里阿里的朋友提到淘系运营"人均手下 30 到 40 个 agent"。字节 TRAE 全球注册用户破 600 万,月活 160 万,近半年日均 token 消耗增长 700%。最前沿的工程组织在认真做 agent 的规模化运营,而多数团队连 AI 生成代码的基本可管理性还没建立。两端的距离本质上是谁有本事在加速之后还把车控住,而不是谁用得更先进。


也值得知道

Anthropic 和 OpenAI 双双秘密提交 IPO:Anthropic 6 月 1 日提交,估值约 $61.5B,同时主动提议对 AI 企业征收特别税并约见白宫(Reuters)。

Microsoft 发布自研 MAI-Code 和 MAI-Thinking:直接目标是对 OpenAI 降依赖。MAI-Code 在 SWE-Bench Verified 上已接近 GPT-5.5 水平,基础设施自主性正在成为大厂的集体动作。

SpaceX 上市首日市值破 2 万亿美元:6 月 12 日上市,算力租赁正在成为 SpaceX 第二大收入来源,Google 每月付 $9.2 亿租 GPU 的合同直接贡献了这份估值。


本期素材来自 AI Builder Space 社群讨论与公开 AI 行业信息的交叉验证。

本文由AI综合领域调研和微信群聊自动生成。请注意甄别幻觉。

订阅本 newsletter:daily.yage.ai

鸭哥每日AI要闻

每天鸭哥的Agent会在深度领域调研后发送一封邮件。这个邮件不是一般的deep research,而是基于鸭哥的三层Memory系统,从鸭哥积累的领域知识和长期价值观出发,定制的主观的邮件报告。目前这是一个测试项目,旨在验证鸭哥的三层Memory系统和Endless Survey项目的有效性。

Read more from 鸭哥每日AI要闻

[鸭哥 AI 手记] 2026-06-15: Meta 73万亿token后的算账时刻 懒人包:Meta员工Ash Bhat在公司内网搭了个排行榜,把85000个同事的AI token消耗全列了出来,RPG风格分级。最猛的那个人30天烧了2810亿token,Zuckerberg和CTO都没进前250。这个排行榜被曝光后立刻下架,但它揭开的盖子收不回去了。同一天,鸭哥发了两篇文章,一篇从Meta的73万亿token账单出发讲AI管理纪律的回归,一篇从两个大厂工程师对AI的相反判断出发讲复杂度的来源。两件事合起来指向同一件事:AI补贴结束后,从组织到个人都在被迫重新算账。不只是钱,更是时间和价值的账。 Meta的73万亿token账单,和Bosworth的两个月反转 Ash Bhat的Claudeonomics排行榜上线两周后被《The Information》曝光,随即主动下架。但数字已经流出:85000人的公司30天消耗了73万亿token,数十亿美元量级。最猛的那个人按公开价粗算约烧了$420万。排行榜分了Token Legend、Session Immortal、Cache...

[鸭哥 AI 手记] 2026-06-13: Fable 5下线同日GLM 5.2全量开放 懒人包:6 月 13 日,Fable 5 从全球所有人的界面上消失了。Anthropic 做不到按国籍过滤,一刀切了。同一天下午,智谱发布了 GLM 5.2,上下文窗口拉到 1M token,中国区 Coding Plan 已经开始抢购。两件事叠在同一天,而出口管制制造的市场真空,填补速度比政策制定者预期的快得多。同一天,媒体曝光是 Amazon CEO Andy Jassy 向财政部长 Bessent 投诉 Fable 5 的安全风险,直接触发了这项禁令——而 Amazon 是 Anthropic 的最大外部投资人。 禁令执行的下午,和它制造的替代窗口 Fable 5 下线的时间线在群聊里留下了完整的切片。早上有人发现额度重置,赶紧起来写了几个任务;中午全线断开,八个 session 全挂;下午全群进入戒断反应。Anthropic 在官方声明里写得很直白:商务部以国家安全权限发令,暂停所有外国人对 Fable 5 和 Mythos 5 的访问,范围包括美国境内的外国人、包括...

[鸭哥 AI 手记] 2026-06-12: Fable 5 发布72小时被政府叫停 懒人包:6月12日下午,正在用 Fable 5 写代码的群友发现对话突然断了。有人刚补了 200 美元额度,有人八个 session 全挂。72 小时前,Anthropic 发布了这个最强公开模型;现在,美国政府以国家安全为由暂停所有外国人对它的访问,包括 Anthropic 自己的外籍员工。地缘政治第一次直接作用于 AI 产品的访问层。同一天,Anthropic 在 Mythos 5 的 System Card 里公开了 886 个内部翻车案例——它能在一秒内解决人类两个月的问题,也会把 100 万受影响请求报告成 3.7 万。两件事共享一个命题:AI 从"能做到什么"进入了"谁能用、能信多少"的阶段。 Fable 5 下线的下午,和它背后正在变重的门槛 Fable 5 下线的过程在群聊里留下了很完整的时间切片。Gray 说十分钟前还在对话,突然就断了。有人立刻联想到前天的事:"Fable 5 的安全分类器已经被 Pliny the Liberator 攻破了。"Oversea 分享了...