[鸭哥 AI 手记] 2026-04-13


[鸭哥 AI 手记] 2026-04-13

> 理解物理的机器人输给了不理解物理的,穷尽功能的平台输给了只做内核的。这三件事有同一个判断:当系统够复杂,放弃压缩比精心建模更有效。

懒人包:鸭哥昨天发了三篇长文。第一篇讲机器人:VLA 不懂牛顿定律,却在操控任务上打败了三十年物理建模积累,关键变量是系统复杂度和数据丰度的交叉。第二篇讲 Shopify 把后台全开放给 AI agent,验证了半年前提出的生成内核框架。第三篇讲 Meta 的 Neural Computer,暴露了端到端学习最硬的天花板:学外观容易,学逻辑难。三篇指向同一个问题:什么时候该停止"先理解再动手",转而搭好基础设施让数据和 AI 自己来。

不懂物理的机器人,为什么赢了懂物理的

鸭哥昨天写了一篇关于机器人控制两条路线的长文,核心判断可以压缩成一句话:物理建模是压缩,VLA 是放弃压缩,当数据和算力越过某个阈值,不压缩的上限更高。

这不是理论推导。Physical Intelligence 的 π₀ 用 3B 参数的视觉语言模型直接预测关节角度,能折叠衣物和组装物品,现在已经开源,用 OpenPI 框架只需一小时真实演示数据就能微调适配新任务(Physical Intelligence)。Figure AI 的 Helix 走闭源路线,直接部署在 BMW 工厂的制造线上(Figure AI)。Boston Dynamics 的 Spot 换成 RL 控制后跑出了 5.2m/s,是原始 MPC 控制器的三倍多(arXiv)。

物理路线自身的演化方向也在印证这个判断。2019 年 ETH 用神经网络替代手工建模的执行器模型,2022 年 Isaac Gym 让大规模 RL 训练成为可能,2024 年 Boston Dynamics 正式在 Spot 上引入 RL。越来越多的组件从手工建模切换到数据学习,物理模型的角色正在从"控制器本身"降级为"训练环境的基础设施"。

群里引证提到"今年很多科技巨头开始下场给具身智能搞数据了"。数据正好是这件事成立的前提条件。机器人训练数据的成本从 2024 年到现在下降了约 60%,目前标准化遥操作数据大约 118 美元一小时(SVRC State of Robotics 2026)。Universal Robots 和 Scale AI 在 3 月联合发布了标准化的模仿学习数据采集系统,目标是打通从实验室到工厂的数据管线(Yahoo Finance)。

鸭哥给出的判断框架有两个维度:系统复杂度(人工建模能压缩多少信息而不丢关键维度)和数据丰度(有多少数据填满状态空间)。火箭发射,复杂度低数据少,物理建模仍然是最优解。厨房操控,复杂度高数据可批量采集,VLA 是自然选择。Tesla FSD v12 是另一个验证:2023 年底把 30 万行 C++ 规则引擎替换成端到端神经网络,条件恰好也是高复杂度(城市驾驶)加高数据丰度(几百万辆车在路上跑)。

这个框架不止适用于机器人和自动驾驶。天气预报、药物发现、芯片设计都在经历相同的替代:NVIDIA GTC 2026 上展示的 AI 加速 CFD,Aardvark Weather 的纯 ML 天气预测,BioNeMo 在药物发现中替代分子物理管线,做的都是在各自领域放弃手工建模(NVIDIA GTC)。深度学习在 NLP 和计算机视觉上已经完成了同一个替代。机器人控制是最新的验证,但不会是最后一个。


Shopify 不做功能了,它做的是让 AI 替你做功能

同一天鸭哥写了另一篇关于 Shopify 的分析,切入点是 Shopify 把整个后台的读写权限开放给所有 AI agent。在一个展示案例里,商家说了一句"帮我优化所有产品的 SEO",Claude 自动更新了 32 条商品。鸭哥在群里分享这篇文章时说:"我们在半年前提了一个 generative kernel 的框架,现在业界似乎也逐渐开始接受这个想法了。"

生成内核的意思是:不再试图穷尽用户的所有需求去开发功能,而是交付三样东西。第一是 AI 替代不了的核心能力(支付、物流、库存)。第二是给 AI 看的知识系统(设计哲学、最佳实践、安全约束)。第三是把高摩擦操作变成单步调用的杠杆工具。这和上面机器人的故事是同一个选择:Shopify 放弃了"我来压缩用户需求",转而搭好基础设施让 AI 去生成具体的解决方案。

数据在验证这个方向。Shopify 商家调查显示约 75% 已经在使用 AI 工具,69% 用于内容生成(产品描述、邮件、广告),AI 驱动的订单量同比增长 15 倍(Shopify Blog)。Shopify 总裁 Harley Finkelstein 3 月 16 日公开说 AI agent 将成为电商的"新前门"(agenticplug.ai)。

对比昨天写的微软 Copilot 在 4.5 亿 M365 用户中只有 3.3% 付费渗透率,Shopify 75% 的 AI 使用率形成了强烈反差。差别在于策略选择:微软试图在旧产品架构上叠加 AI 功能(压缩),Shopify 直接把 AI 当成操作商店的第一入口(放弃压缩)。Salesforce 选择自己养 AI agent,WooCommerce 选择被动适配,Shopify 走了第三条路:自己不做 AI,把舞台搭好让所有 AI 来运作。

这两个领域的共同逻辑值得提炼。机器人控制中,物理方程压缩的天花板由人的建模能力决定。软件平台中,产品功能压缩的天花板由团队对用户需求的想象力决定。两者的共同点是:当系统复杂度超过任何单一团队的建模能力,正确的策略是退回到内核,把组合留给数据和 AI。

但放弃压缩也有天花板。鸭哥的第三篇文章分析了 Meta 的 Neural Computer:用视频模型端到端地模拟终端和 GUI,视觉渲染达到 PSNR 40.8dB(人眼几乎分辨不出差异),但两位数加法几乎全错。群里郝小贱看完论文说"Meta 这个新论文要模型吃掉 CLI",LangSensei 贴了完整总结。从 Pac-Man 到 DOOM 到 Minecraft 到 Ubuntu 桌面,每一步都撞上同一堵墙:学会外观比学会逻辑容易得多。110 小时脚本化数据的训练效果超过 1400 小时随机录屏,数据质量远比数量重要(MarkTechPost)。

这划出了端到端学习当前的硬边界:在需要符号精确匹配的任务上,视频模型的训练目标和任务需求根本不兼容。放弃压缩有效的前提是任务可以从统计规律中涌现,而不是要求形式化的逻辑推理。知道什么时候该放弃压缩,和知道什么时候不该放弃压缩,是同一个判断能力的两面。


也值得知道

Claude 全线 500 错误持续约一小时:4 月 13 日 UTC 21:00 左右,Claude Code、claude.ai 和 API 同时出现间歇性 500 错误,群里多人报告被强制登出。Anthropic 确认为重大故障,约 21:24 UTC 修复。群友 CopyCat:"原来是又发布屎山代码了。"(Cyber Security NewsThe Register

OpenAI 发布 AI 政策提案:呼吁新的产业政策、税收改革和社会安全网来应对 AI 驱动的就业冲击。原话:"我们正在进入一个将从根本上重塑工作、知识和生产的新阶段。"同日 Sam Altman 发文回应 New Yorker 的批评文章。(AOL Finance

群里 Claude Code 成本讨论仍在继续:弓长张说中转 API 没缓存"跑三个中大任务直接 50 刀没了",鸭哥说自己用完 5 小时配额后 extra usage 一下干掉快 100 美元。宝玉发现有 app 在后台偷偷调用 claude -p 总结文档,完全无感知。Excellent 的解法是 5 个 Max 账号轮换加 Ubuntu 多开。


本期素材来自 AI Builder Space 社群讨论与公开 AI 行业信息的交叉验证。

本文由AI综合领域调研和微信群聊自动生成。请注意甄别幻觉。

订阅本 newsletter:yage-ai.kit.com

鸭哥每日AI要闻

每天鸭哥的Agent会在深度领域调研后发送一封邮件。这个邮件不是一般的deep research,而是基于鸭哥的三层Memory系统,从鸭哥积累的领域知识和长期价值观出发,定制的主观的邮件报告。目前这是一个测试项目,旨在验证鸭哥的三层Memory系统和Endless Survey项目的有效性。

Read more from 鸭哥每日AI要闻

[鸭哥 AI 手记] 2026-04-21 > 今天刷屏的几个数字都很大:600 亿、1000 亿、1.75 万亿、5 GW。但推动这些数字真正落地的,是几条不在新闻通稿里的约束:编程行为数据的入口、Windsurf 前例里定义过的员工契约结构、以及太空里散热板的平方米数。鸭哥昨天三篇文章正好各自卡在一条约束上。 懒人包:SpaceX 今天给 Cursor 开了两张牌,要么年内 600 亿收购,要么改付 100 亿做技术合作。鸭哥 昨天那篇 把这笔交易和 Inflection、Windsurf、Groq 这两年流行的反向 acqui-hire 放在一条线上看:600 亿面值 vs 员工真实 payout 已经被 Windsurf 示范过怎么脱钩。同一天 Musk 把太空数据中心"30-36 个月内成为最便宜 AI 算力"写进了 IPO 路演叙事,鸭哥 另一篇 用 ISS 的 126 kW 说明散热是物理差距,不是融资差距。第三条线是鸭哥 UI 设计工作流那篇,拆出格式转换、保真度、跨介质沟通三个互锁机制,AI 只啃动了最浅的那个。Figma 股价 4 月 17 日当天跌...

[鸭哥 AI 手记] 2026-04-20 > 一组动词需要一个名字才能进简历、进 JD、进采购单。Harness engineering 这三个月的火,本质是给一堆没法定价的实践工程师起了一个能开发票的名字。也是这个月,腾讯云、阿里云百炼、Microsoft Copilot 同时收紧补贴,那张让人敢拿这套实践去练手的廉价入场券正在涨价。 懒人包:鸭哥昨天那篇 Harness Engineering 到底是什么 解释了一个反常现象,AI 圈每隔几周就有新词被推上来又被换掉,harness 持续了三个月还没散。背后机制不是新原则,是给一组散落动词起了一个硬名词。当天群里还有第二条主线,腾讯云 Coding Plan 4 月 20 日下架换成按 token 计费,阿里云百炼 Lite 4 月 13 日停止续费,Microsoft 把 Opus 4.5/4.6 从 Pro+ 移除只留 4.7,cc club 第三方中转半年从 1699 涨到 2499,理想说"国内定价又把新手的路堵死了"。两条线指向同一件事,AI...

[鸭哥 AI 手记] 2026-04-19 > 当模型接口统一成一个 HTTP endpoint 之后,真正贵起来的是那些没法被 endpoint 封装的东西:能被复利的数据、能阻止账单失控的治理、能追溯出处的验证链。鸭哥昨天连发三篇文章,今天群里正好在各自的位置上把这条线拖出来。 懒人包:Cursor 以 $50B 估值融 $2B+,纯 API 消费的独立编程工具一家没做到 $100M ARR,鸭哥那篇文章把这件事讲透:没有自研就没有数据飞轮。jay luo 在群里直接问 OpenRouter 要不要用,鸭哥两个小时内发了一篇校准文章,结论是门槛低,但三个隐性成本可以把 5.5% 手续费放大一个数量级;jay luo 看完就打消了念头。yousa 买羊毛烘干球被伪造学术引用坑到,鸭哥顺手做了一期调研,NewsGuard 同期的数据显示 AI 内容农场每月新增 300-500 家。就在今天 Vercel 被攻破,入口是 Context.ai 这个第三方 AI 工具的 OAuth。三件事放在一起,信任链在同一个时间窗口从两端同时被磨薄。 Cursor 的 $50B...