[鸭哥 AI 手记] 2026-02-26


同一个 LLM,给它不同的上下文,输出质量天差地别。所以管理 AI 的核心不是选哪个模型,而是设计什么样的上下文。

懒人包:Opus 做思考、便宜模型做执行的分层工作流正在成为主流用法,它背后的逻辑是思考和执行的成本结构完全不同。OpenClaw 作为公司级 AI Infra 的定位正在被验证,核心价值不是智能本身而是”在熟悉的界面里用上 Opus”。另外,AI 时代的工作时间反而变长了,原因不是效率不够,而是人的角色还没从 IC 升级到管理者。


Opus 做思考,便宜模型做执行

鸭哥又摸索出来一个”穷逼”的搞法:在 OpenCode 里先用 Opus 做深入思考,然后让它写 prompt 文件,再调用 API submit 一个 job,用更便宜的模型通过那个文件进行交接继续执行。群里的实践也印证了这个思路:有人让 Opus 写 plan,GPT review,来回几轮迭代之后用 Sonnet 写代码,Composer 做 CI/CD。另一个人只用 Opus 做 plan,写代码都改用 Codex + Kimi。

这个分层背后的结构性原因是:思考和执行的成本曲线完全不同。思考阶段需要的是智能密度,输入输出 token 都少,但对推理质量要求极高。执行阶段需要的是吞吐量,按照已经定好的 plan 批量写代码,智能要求可以降级。所以不是”用更强的模型就更好”,而是在对的环节用对的模型。群里有人说 Opus 写代码感觉不只是不划算,还很难一个 plan 从头写到尾,没事找你对齐一下。这正好说明了为什么分层是必要的。

这个模式的非显然推论是:它和企业里“正式员工 + 实习生/外包”的降本模式是同构的。正式员工定方向、拆任务、定标准,实习生执行。你不会让实习生去做架构设计,也不会让高级工程师去写样板代码。鸭哥的”三个臭皮匠”工作流更进一步:让 Qwen 3.5、GLM-5、Codex、Sonnet 各自写一份文档,然后让 Opus 综合分析,找出冲突和启发。Opus 的价值不在于替代它们,而在于做“什么叫对”的判断者。


OpenClaw 作为公司级 AI Infra

Bowen 分享了一个有意思的案例:他把 OpenClaw 定位为公司里的 AI Infra,像水龙头一样,打开就能喝到干净的直饮水。他的 20 多人小公司,春节前两天开始部署,目前所有人都用上了。方法很简单:一个人部署,把机器人拉进飞书群就好了。之前推 Trae CN + Skills,推起来很费劲,但龙虾就很顺利。

为什么会这样?核心原因不是智能差异,而是界面熟悉度。课代表说他去华大教课,问台下的学生谁打开过 Mac 的 Terminal,0 人举手。展示了一下 ls,三个人打哈欠。这不是个別现象。之前做过更广泛的统计,所有人中真正用 AI IDE 写代码的人仅占 0.2% 左右。绝大多数自认为”经常用 AI”的“熟练用户”,90% 的操作是用 ChatGPT 写代码然后拷到 IDE 里跑。

这个现象的非显然推论是:“降低门槛”和“降低功能”是两件事。龙虾的价值不在于它比 Cursor 更强,而在于它让不会用 Cursor 的人也能用上 Opus 级别的智能。在熟悉的 GUI 里用上顶级模型,这个价值对绝大多数白领来说是巨大的,即便他们不写代码。chenqin 的观察很有意思:他给学生推荐 Codex 时反馈都是不明觉厉,事后没几个人用。但提了一下 OpenClaw,事后好几个学生都用上了。差别在于一个需要你改变习惯,另一个能融入你已有的习惯。


AI 时代的工作时间反而变长了

最扎心的观察来自群里几个人的共同感受:有了 AI 之后,工作时间反而变长了。Adrian 说自从有了 OpenClaw,自己的工作量增加了三倍,原来很多放空的时间现在也在工作,拿着手机都在想事,觉得自己跟不上 AI 的节奏。谷雨提到看了一个调研,说大家工作时间反而变长了,因为之前干不了的事现在都可以干了。

这个现象背后的结构性原因是:AI 扩大了你的能力边界,但也扩大了你的责任边界。以前能想 100 件事能干 10 件,现在能干 50-60 件,但能想的更多。越干越多,越想越多。Fermi 的焦虑很有代表性:作为 PhD 学生,感觉很快就没什么可做的了,用 AI 做副业赚钱的窗口期好像也就这段时间,担心机会错过就没了。

但这里有个非显然的转折。工作时间变长不是 AI 不够强,而是人的角色还没有从 IC(个人贡献者)升级到管理者。当你学会了如何管理 AI,而不是跟它抢活,工作的感受就会完全不同。鸭哥说“要管理 AI,做经理,别去跟手下抢活”。有人发现 CC 可以直接在命令行里把整个 prompt 扔进去在后台跑,同时 scale 出几十个 agent,当天 token 就爆炸了。但这恰恰是从 IC 到管理者的转变的起点:你不再亲自写代码,而是定义任务、分配资源、验收结果。

这个转变的难度被严重低估了。有人在公司做 AI interview,发现大部分人连 Cursor 都用不利索,换句话说大部分人还没严肃地用 AI 干过活。鸭哥在公司做 talk,内容就是“如果我只能告诉你一件事,就是别再用 ChatGPT 了,用 Cursor 做所有事情”。这个建议看起来很简单,但它背后是一个深层的认知转变:从“问 AI”到“管理 AI”,从消费式的工具到投资式的工具。


也值得知道

Anthropic 为开源项目提供免费 Claude 额度:维护者可以申请 6 个月 200 美元的免费额度,条件是项目有 5000+ GitHub stars 或 100万+ 月度 NPM 下载。即便不完全符合标准,只要你维护的东西“生态系统惄惄依赖着”,也可以申请(Claude for OSS)。

有消息说 DeepSeek V4 在预发布阶段未按惯例向 NVIDIA/AMD 开放,而是将早期访问权限独家授予了华为等国内供应商。DeepSeek 已在昇腾平台完成模型迁移,推理速度提升超 35 倍。这反映了国内 AI 生态的加速发展。


本期素材来自 AI Builder Space 社群讨论与公开 AI 行业信息的交叉验证。

本文由AI综合领域调研和微信群聊自动生成。请注意甄别幻觉。

订阅本 newsletter:yage-ai.kit.com

鸭哥每日AI要闻

每天鸭哥的Agent会在深度领域调研后发送一封邮件。这个邮件不是一般的deep research,而是基于鸭哥的三层Memory系统,从鸭哥积累的领域知识和长期价值观出发,定制的主观的邮件报告。目前这是一个测试项目,旨在验证鸭哥的三层Memory系统和Endless Survey项目的有效性。

Read more from 鸭哥每日AI要闻

洗衣机让你洗更多衣服,AI 让你写更多代码。效率工具从来不减少工作量,它只改变瓶颈的位置。 懒人包:群友 yousa 用《More Work for Mother》的家务悖论类比 AI 编程,触发了一个关键问题:效率提升到底去哪了?数据显示瓶颈已经从写代码转移到了验证代码。与此同时,国产 AI 编程工具的定价权正在从模型方滑向基础设施方,智谱涨价 9 天后就被阿里云 7.9 元套餐截流。而 Claude 在登顶 App Store 的同一天全球宕机,完美诠释了什么叫”成功税”。 你的效率提升,被谁吃掉了? 群里 yousa 分享了一段让人不太舒服的历史。1983 年,历史学家 Ruth Schwartz Cowan 研究了一个反直觉的事实:美国家庭从 1920 年代到 1970 年代陆续买了洗衣机、吸尘器、微波炉,但家庭主妇每周做家务的时间几乎没有减少。原因很简单,有了洗衣机之后衣服从一周洗一次变成穿一次就洗,效率提升被更高的标准吃掉了。 yousa 紧接着说:”多像现在的 AI Coding 提升效率的事情。” 这不是随口一说。SonarSource 的 2026 开发者调查...

Block 砍掉 40% 的人,股价涨了 20%。学术研究却发现资深工程师用 AI 反而更慢。两件看似矛盾的事指向同一个结论。 懒人包:Block 的 Jack Dorsey 用”100人+AI=1000人”的逻辑裁掉四成员工,华尔街报以 20% 涨幅。同周群里鸭哥的 Opus 已能自主编排 agent、质检、发邮件汇报。但 METR 的随机对照实验发现资深开发者用 AI 反而慢了 19%,还自以为快了 20%。差距的根源不是 AI 的能力,而是人类能不能从”做事的人”变成”管理 AI 的人”。 Block 裁员 40% 背后的逻辑 2 月 27 日,Block 的 Jack Dorsey 宣布裁员约 4000 人,从 10000+ 减到不到 6000,接近 40%。致股东信写道:”智能工具已改变建造和运营公司的意义。一个显著更小的团队,使用我们正在构建的工具,可以做得更多、做得更好。”(AP News)这不是因经营困难裁员,Block 毛利润一直在增长。消息公布后股价暴涨超 20%(Forbes)。Dorsey 甚至在 X...

当 AI 的瓶颈从”能力不够”变成”数据到不了手边”,整个基础设施的逻辑都要重写。 懒人包:鸭哥的三层记忆系统从设计走向了可运行的 newsletter pipeline,关键不是记忆本身而是 sub-agent 的非轮询调度模式。陈然分享了一套数据驱动的 SEO/GEO 增长方法,核心洞察是 2-3 周的反馈延迟反而构成竞争壁垒。CC 压缩上下文时不保留项目理解只保留聊天记录,暴露了当前 AI 编程的一个结构性局限。 从三层记忆到可运行的系统 鸭哥之前聊过三层记忆的概念,今天第一次详细展开了实现。第一层是流水账:AI 做完每个操作,心得和可复用的东西一股脑 append 到文档末尾。第二层是每日复盘:另一个 AI 把流水账汇总,90% 直接扔掉,剩下 10% 按类别归档为可复用的领域知识。第三层是长期升华:每周或每月对反复出现的模式做反思,沉淀为价值观和偏好级别的长期记忆。鸭哥目前有 36 个领域见解文档,每个是一个长期稳定的观点。 当 AI 需要调用这些记忆时,用的是 progressive disclosure:通过主层 index...