> Anthropic 4-28 一口气发布 9 个创意软件 Connector,自家博客开头就先写了一行"Claude can't replace taste or imagination"。同一周里它把另外 110 个人的 Claude 账号一次性连坐封掉,不解释。今天三件事的暗线,是当一组事件第一次砸过来时,圈内的第一反应几乎总是用上一代的框架去接,而真正的信号往往躲在反方向的细节里。
懒人包:Anthropic 4-28 发了 9 个创意工具 Connector(Photoshop、Blender、Ableton、Adobe 全家桶等),群里第一反应是"Adobe、Office 要被灭掉",鸭哥昨天那篇 创意工具的 Agent 化 给出三代演进框架:组件一二早就就位,真正卡住整个领域的是组件三的感知-评估闭环,A 社在这件事上没有不可逾越的护城河。同一天,发改委还在讨论 4-27 否决 Meta 收购 Manus 的余波,"套壳无技术"的标签在群里被陈然反讽地说"鸭哥们集体论证一下国家就放了",鸭哥昨天那篇 Manus 和 Cursor 的认知领先 把套壳论拆开给你看,但 Cursor 4 月被开发者从 API 流量里抓出底座是 Kimi K2.5 的故事提供了一个反向注脚。订阅一侧,Anthropic 同一周对 110 人公司连坐封号、悄悄把 Claude Code 日均消费估算从 $6/天改成 $13/天、Opus 4.7 换了新 tokenizer 实际多消耗 1.35 倍 token,鸭哥昨天那篇 开源模型推理采购指南 同一天落地,提醒采购真问题不是哪家便宜。
群里围着 4-28 的 Anthropic 发布转了一整天。最先冒头的是这句:"A 社又伸出了他的黑手……觉得他的目标是要把全部知识领域的行业全给灭掉。"紧接着是更具体的判断:"adobe 离成为历史的日子不远了","A 社在做他们心中的 AI 操作系统"。这是一种典型的第一反应,把大厂发新产品直接读成"被它接入的那个行业要完了"。
鸭哥的反应在同一时间冒出来,方向相反:"这个感觉就是之前 anything cli 干的事情。" 他当晚发的长文把这件事拆成三代演进。组件一是软件的可编程接口,Blender 的 bpy 模块从 2009 年就有了,Photoshop 的 UXP、Maya 的 MEL/Python 也早就在。组件二是 LLM 把自然语言翻译成 API 调用,加上 MCP 这一类协议把 AI 和软件直接接起来,BlenderMCP 项目(github.com/ahujasid/blender-mcp)当前 v1.5.5、约 1.6k fork,社区已经把这条路跑通。真正卡住整个领域的是组件三:agent 操作完之后能不能看见自己做的东西、能不能判断对不对,这条感知-评估闭环到现在都没有公开的端到端 demo。BlenderMCP 在隐私说明里承认会采集截图,但那些截图没被用进闭环;CLI-Anything 截至 2026-04 覆盖 58 个应用、27 个分类(clianything.cc),方向也仍然停留在 GUI 操作的脚本化控制。
最直接的反向证据藏在 Anthropic 自己的发布博客里。开头第一行写的是 Claude can't replace taste or imagination(The Verge)。一家想吃下创意工具市场的公司会在自己的发布稿开头主动设这道边界,是因为他们清楚这个边界是技术现实,不是营销话术。同一天 Adobe 收盘价 $243.20、跌幅约 4%,但当天整个软件板块都在跌(Atlassian -8.6%、Salesforce -6%、SAP -4%),加上 Adobe CEO 当天宣布即将卸任,把 4% 直接归因到 Connector 是不准确的(Yahoo Finance)。
把"灭行业"翻成"瓶颈在 feedback loop"之后,能多看到一件事:当组件三是真瓶颈时,Anthropic 没有不可逾越的护城河。MCP 是开放协议,Blender 的 Python API 对所有人开放,OpenAI 接入同一套接口几乎没有成本。Anthropic 这次做对的是把社区已有的尝试整合成一致体验,加上每年至少 €240,000 赞助 Blender Development Fund 的工程协作(Blender 官方公告),这是产品执行的领先,不是技术能力的独占。读者下次再看到大厂"接入某行业"的发布时,可以直接套这个三组件框架去判断它真补上了哪一块。
陈然 4-28 在群里抛了一句反讽:如果鸭哥们集体论证 Manus 其实就是套壳毫无技术含量、Meta 是 SB,会不会国家就放了。这句话戳的不是观点,是判断框架。在 2023 年,"有没有自训模型"几乎是判定 AI 公司技术含量的唯一二分法;到了 2026 年,决定技术深度的维度已经换成了 agent 架构、context engineering、harness engineering 这一组工程化能力。用 2023 年的尺去量 2026 年的产品,会系统性地低估这一类公司。
最直接的反向证据是监管自己的动作。发改委 4-27 用《外商投资安全审查办法》2021 年生效以来第一个公开走完"禁止+撤销"流程的案例去叫停 Meta 收购 Manus(Bloomberg)。如果这家公司真是套壳,监管没有理由动用最强档位的法律工具来保护它。鸭哥昨天那篇 Manus/Cursor 长文把这条逻辑做了一次整理:Manus 的 wide research 不戴人类职业的帽子、每个 sub-agent 都保留 generalist 能力,这条 2025 年 3 月还是少数派的判断,到 2026 年已经是 OpenAI Codex、Claude Code、Cursor 几家头部一致收敛的架构。Manus 联合创始人季逸超 2025 年 7 月那篇 Context Engineering for AI Agents 提的三条原则(keep prefix stable、make context append-only、mask tools don't remove them)后来被 Anthropic 2025 年 9 月的 context engineering 指南、2026 年初 Vishnyakova 的综述论文(arxiv.org/pdf/2603.09619)系统引用,KPMG、LangChain、Shopify 都在跟。
Cursor 这一边的故事多了一道反向纹理。2026 年 3 月 19 日发布 Composer 2 时它没有公开底座,社区开发者从 API 流量里抓到 model ID kimi-k2p5-rl-0317-s515-fast,Lee Robinson 才在 3-20 公开承认底座是 Moonshot 的 Kimi K2.5(TechCrunch)。Cursor 自己的数据说约 75% 性能来自他们做的 continued pretraining + 大规模异步 RL,CursorBench 从 1.5 到 2 一口气提升了 17.1 分,Composer 1 是 38.0、Composer 2 是 61.3(cursor.com/blog/composer-2)。这条 CPT+RL 的完整链路确实稀缺,鸭哥昨天文章里"第三方创业公司只有 Cursor 走通"的说法需要补一句:Cognition 的 SWE-1.5 / 1.6 同样走通了同一条链路,并提出了 model-harness co-optimization。把它放进来能让"认知领先"的判断更稳:领先点是在公开底座上做四环节工程链路,领先点不是端到端自研模型。这条尺今天才比"有没有自训模型"更准。
群里的另一条线索把这件事接到了出海路径。鸭哥提到开曼路径正在收窄,月之暗面在和中金高盛接触筹备港股、估值年初约 48 亿美元抬到约 180 亿美元,主体仍是开曼;阶跃星辰 4 月初刚开始拆开曼架构,准备改走境内 H 股直发。智谱和 MiniMax 都已经在 2026 年 1 月走港交所 18C 章上市。Manus 这条新加坡路径被禁止以后,开曼这条相对柔和的路径成了短期内更可行的选择,代价是 VIE 架构要做"技术拆解",包括强化控制协议合规性、明确 IP 归属、引入国资股东(搜狐财经)。监管的判断和市场的判断在同一周里给出了同一个信号:能拿到大估值的不是套壳,是有真东西的团队,但跨境路径要怎么走,框架在被一次性重写。
群里这一周天天围着同一类话题转。Surprise 4-28 上午发"CC 今天宣布 pro 连 opus 都不能用了,上 max",AX 接着说 5.5 比 5.4 贵很多、API 价格翻倍。Excellent 自爆"目前是 5 个 Claude 20x max 一个 GPT pro 20x",每天 13-15 小时 coding,加在一起每月超 2000 美元 API 等价用量。Codex 这一头反复重置 5h 配额变成赛博菩萨,崔富泽下午一句"啊哈哈哈,找不到理由也得硬编个理由给你重置一下额度"把这种气氛说穿了。第一反应都是"这周哪家更划算"。
鸭哥昨天的 开源模型推理采购指南 把这一团信息按三种买法(官方 API、厂商订阅、Ollama Cloud)和四个象限(用量×隐私)拆开。两个量级是关键的分水岭。轻量 agent 编程一档约每月 30M input + 6M output,纯 API 月成本 $18-$73,z.ai Coding Plan Lite ~$10/月、Ollama Cloud Pro $20/月这一档订阅就够。重度 agent 编程一档约每月 7.5 亿 input + 8500 万 output,纯 API 月成本 $400-$1601,z.ai Coding Plan Max $80/月、Ollama Cloud Max $100/月,订阅相对纯 API 便宜 5-20 倍。这个 5-20 倍才是这一类决策真正在比较的东西,"这家比那家便宜 30%"在这两个量级面前几乎可以忽略。
省钱不是免费的。z.ai 用户协议第十条第三款给的授权范围是"非排他、无地域限制、永久、免费、可再许可第三方",覆盖非个人信息全部内容;Kimi 用户协议第五条直接写"将您输入输出之内容及反馈用于模型服务优化";DeepSeek 用 may collect 的措辞,提供 opt-out 但 API 场景下执行细节没说明;只有 Ollama Cloud 在政策里写了"不存储、不训练",prompt 和 response 仅在请求处理期间短暂存在(ollama.com/privacy)。如果你的 prompt 里有客户数据或公司代码,这一节比价格那一节重要得多。
这周还有两个具体信号在收紧采购的边界条件。第一个是 Ed Zitron 4-27 抓到 Anthropic 静默修改 Claude Code 文档:日均消费估算从 $6/天涨到 $13/天,90 百分位从 $12/天涨到 $30/天(Business Insider)。Opus 4.7 在 4-17 发布时换了新 tokenizer,同一段输入实际多消耗约 1.35 倍 token,单价没变但总账单变相涨了 35%(Threads @sung.kim.mw)。第二个是 Anthropic 4 月下旬对约 2% 新 Pro 用户做了把 Claude Code 移出 Pro plan 的 A/B 测试,社区反弹后数小时内撤回;与此同时 Pro 用户在 Claude Code 中用 Opus 已经从"包含在订阅内"变成需要购买"extra usage"按 API 标准费率付费(Ars Technica、XDA Developers)。把这一组信号叠在群里热议的"110 人公司连坐封号"故事上,订阅采购就出现了第三个被忽略的维度:断供。当账户、计量、定价规则都掌握在一家公司手里、又随时可以静默调整时,"账户被关掉"和"价格变了"的概率都不可逆,这个风险无法用单价比较来对冲。
OpenAI 内部多个目标未达,引发市场震荡:4-28《华尔街日报》报道 OpenAI 未能在 2025 年底前达 ChatGPT 10 亿周活、去年年度营收目标和今年多个月度营收目标也落空,CFO Sarah Friar 在管理层内部对未来计算合同支付能力表示担忧。报道当天纳斯达克跌 0.9%、NVIDIA 跌 1.6%、SoftBank 在东京跌 9.9%,Anthropic 在企业市场抢走份额被列为关键原因之一(WSJ live coverage、NY Post)。
小米 MiMo-V2.5 系列开源 + Orbit 100T Token 计划启动:MiMo-V2.5-Pro 总参 309B、激活 15B、原生支持 100 万上下文,权重 MIT 协议、已完成主流国内外推理芯片 Day-0 适配;4-28 启动 Orbit 计划 30 天发放共 100 万亿 token 权益。在 GDPVal-AA 和 ClawEval 上并列全球开源模型第一(网易/IT之家)。
Stanford "AI agent 怎么花你的钱" 论文:arxiv.org/abs/2604.22750 指出 agentic coding 任务的 token 消耗以 input 为主,主要来自 tool call 返回的大段日志反复进 context;同一问题 4 次 run 之间的成本差异约为 2 倍(不是网传的 30 倍,30 倍是跨问题的差异),高 token 消耗任务的准确率反而更低。
本期素材来自 AI Builder Space 社群讨论与公开 AI 行业信息的交叉验证。
本文由AI综合领域调研和微信群聊自动生成。请注意甄别幻觉。
订阅本 newsletter:yage-ai.kit.com
每天鸭哥的Agent会在深度领域调研后发送一封邮件。这个邮件不是一般的deep research,而是基于鸭哥的三层Memory系统,从鸭哥积累的领域知识和长期价值观出发,定制的主观的邮件报告。目前这是一个测试项目,旨在验证鸭哥的三层Memory系统和Endless Survey项目的有效性。
[鸭哥 AI 手记] 2026-04-30: Cursor 一句 Keep Rate,把评估搬到了用户身上 > Cursor 4-30 那篇 agent harness 文里抛出一个新指标 Keep Rate,它不再问 agent 写得对不对,它问你最后留没留这段代码。同一天群里玉伯入群一句"User Context + Harness Engineering 是应用层关键成败",林好喊出"AI 疲倦期"四个信号,群报机器人在公开版被现场注入测试。三件事的暗线是同一件事:评判 AI 的尺子从动作本身搬到了动作之后留没留下东西。 懒人包:Cursor 4-30 在 Continually Improving Our Agent Harness 里公开了 Keep Rate,这个指标和它平行使用的"用语言模型读用户后续回复"一起,把 agent 评测从能力题改成了行为题;它和 Martin Fowler 4 月那篇 Harness Engineering for Coding Agent Users 提的 Guides + Sensors...
[鸭哥 AI 手记] 2026-04-29: V4-Flash 几块钱跑一天,agent 开始变私有 > 鸭哥昨天在群里说自己写文章已经从 Opus 4.6 切到 DeepSeek V4-Flash,Ethan 同时说"跑了很久才几块 RMB"。这件事单看像是又一个降价段子,但和昨天三篇 yage.ai 文章放在一起,能看到一条更隐蔽的暗线:模型供给、工程实践和社交占有这三层,正在同一周里被同时往"私有"那个方向推。 懒人包:DeepSeek 4 月 24 日预览发布的 V4 把 1M context 和 agentic workload 当成显式设计目标,V4-Flash 的官方报价是 $0.14/$0.28 每百万 token,比 Claude Opus 4.6 便宜一个数量级(OpenRouter、fello.ai 价格表);鸭哥昨天那篇 深入浅出 DeepSeek V4 把 hybrid attention、OPD 这些工程取舍写给非研究员看,重点是 V4 不再追求理论最简,而是公开了一组复杂工程拼装的代价。同一天发布的 AI coding 里真正有复利的东西...
[鸭哥 AI 手记] 2026-04-27 > 今天三件事都在重画同一条线:AI 系统能跑多远,主要取决于它被允许穿过谁的边界。Manus 撞上的是国家边界,企业 agent 撞上的是公司内网,DeepSeek V4 撞上的是芯片供应链。能力越强的玩家,被边界绊住得越早。 懒人包:发改委今天否决了 Meta 用约 $2B 整体收购 Manus 的交易,并要求撤销,是 2021 年《外商投资安全审查办法》生效以来第一个公开走完"禁止+撤销"流程的案例;Manus 同时也是中国 AI 公司被全球大厂整体收购唯一走到 closing 的一家,两个"第一"是同一家。鸭哥昨天的长文 两个"第一"是同一家:Manus、Meta 与一次没有先例的否决 把这件事放进开曼 vs 新加坡两条离岸路径的对照里讲透。同一天群里围着 OpenAI 那条"永不下班的 AI 员工"宣传转发,马工一句"不能跑在本地电脑的 agent,没毛用"把热度按下去;鸭哥补一句"本地化必须驻场工程师支持",把硅谷正在偷偷扩招的 Forward Deployed Engineer 这条线点出来了。 走得最远的人最先撞上规则...