[鸭哥 AI 手记] 2026-02-24

把 analytics data、代码和 git history 放在一起,AI 就能自己发现什么 work 什么不 work。这不是偷懒,这是在把判断力系统化。

懒人包：有人尝试把 analytics data 做 daily dump 放进 monorepo,让 AI 实现”半自治”决策;Cursor 和 OpenAI 的最佳实践收敛到同一个方向:不要分角色,只要 planner + executor;群里讨论 AI 看门狗和 guardrails,因为有人的 OpenClaw 又把自己改死了。

当 AI 能同时看到代码和数据

群里有人分享了一个实践:把 analytics data 做 daily dump 放进代码仓库。听起来有点反直觉,毕竟传统做法是代码归代码、数据归数据库、分析归 BI 工具。但他发现效果非常好:AI 能根据 analytics data 理解产品做了什么,结合 Git history 理解什么改动带来了什么结果,然后自己判断下一步该做什么。他的原话是”基本实现了半自治”。

这个想法的价值不在于技术实现(daily dump 谁都会写),而在于它打破了一个长期存在的信息隔离。传统的产品开发流程是:PM 看数据做决策,工程师看代码做实现,QA 看测试做验收。每个人只看到大象的一部分。现在如果把所有信息放在同一个 repo 里,AI 就能同时看到完整的画面:代码做了什么改动、数据显示了什么效果、用户行为发生了什么变化。

鸭哥的评价是”分析、运维、实现、测试、报告,一把梭”。这正是 monorepo 思路的终极形态:不只是代码的 monorepo,而是一家公司所有可机读信息的 monorepo。有人担心 repo 太大 GitHub 有 limit,有人说”一个 repo 含历史几个 T 一样跑,只问自己硬盘装不装得下”。更务实的建议是统计数据不一定要放 git 里,需要时用 MCP 拉下来就好,避免干扰 merge。

但这里有一个更深的洞察:当 AI 能同时看到 what(代码)和 so what(数据)时,它就具备了做 why 和 what next 的基础。这不是让 AI 替代 PM,而是让 AI 成为一个始终在线的、能回答”上次那个改动效果怎么样”的队友。

最佳实践正在收敛

鸭哥分享了 Cursor 的一篇文章”Self-Driving Codebases”,讲的是大规模并行 agent 开发的实战经验。他的观察是:Cursor 最终收敛到的最佳实践,和群里长时间以来的观点高度一致。

具体来说,三个关键共识正在形成。第一,不要分 PM/Dev/QA 等角色,只需要 planner 和 executor。传统软件工程的角色划分是为了管理人的认知局限,但 AI 不需要这种划分。第二,Prompt 里要多说边界在哪里,而不是详细说要做什么。这和管理优秀人才的道理一样:给 goal 和 environment,不要给 step-by-step。第三,不需要保证每个提交都是正确的,整个 swarm 会自己震荡然后稳定。

这第三点最反直觉。传统的 CI/CD 流程要求每个 commit 都通过测试才能合并。但在多 agent 并行开发时,这变成了不切实际的要求。更好的策略是让 agent 快速提交、快速发现问题、快速修复,整个系统通过高频迭代而非单点完美来收敛。

鸭哥还提到一个教训:之前从新闻上看到 Cursor 做浏览器被打脸,觉得很傻就跳过了。但真的读了原文才发现,核心价值根本不是做了浏览器,而是介绍怎么用很多个 Agent 互相配合。关于用了第三方依赖库,文章里明确讲了这是一种 failure pattern 以及怎么克服。”所以这整件事也不是像网上说的那么戏剧化。”这个教训适用于所有 AI 新闻:二手信息的信噪比已经低到不可接受,必须回到原文。

AI 需要看门狗,不是更多的信任

群里最近频繁出现一个问题:AI 把自己改死了怎么办?有人的 OpenClaw 昨晚”自杀”了,把自己的 memory 清空了(但 soul 没清空,于是有人问这算不算转世)。还有人让 OpenClaw 指挥 Claude Code 干活,早上起来发现 CC 昨晚跑挂了。

这类问题的本质是:AI 在长时间无人值守运行时,没有足够的 guardrail 来防止它做出不可逆的操作。群里讨论了几种方案。最简单粗暴的是看门狗:定期备份关键文件,一旦 AI 把自己改死就强制恢复拉起来,顺便给它发一条”你把自己改死了”的消息。更系统化的是用 hook 来批判 AI 的 tool usage,一些常见的错误(比如在错误的文件夹里跑 build)可以直接 reject 并告诉它哪里可以跑。

有人想做更进一步的硬性 guardrail:不依靠 AI 的”自觉性”,而是在 API 输出到命令执行之间做语句检查。但这很难做到通用,因为检查脚本的正确性本身就是一个和写代码一样难的问题。

鸭哥的态度更务实:agent 评价自己执行的东西”会非常的宽松”,所以不能指望 AI 自我监督。但也不需要追求完美的防护,一个看门狗加定期备份已经”打败了 99% 的 OpenClaw 用户”。这个世界本来就是个草台班子。

也值得知道

Cloudflare 用一个工程师、800 个 OpenCode sessions、1100 美元,基于 Vite 重写了 Next.js。Build 快了 4 倍,开发中有 1700 个 Vitest 测试和 380 个 E2E 测试。这可能是目前公开的最具说服力的 AI native 开发案例之一。

鸭哥被 Tavily reach out 说是 one of the most active users。他穷尽了最高 plan 每个月还往里 pay as you go。有人评论”付费到位了”,但这也反映了一个现实:AI 时代高质量的搜索和验证能力正在变成基础设施,而基础设施的成本不会消失,只会转移。

有人搓了一个”教员锦囊”系统 prompt,基于毛选四卷本的战略体系做决策辅助。不管你怎么看这个应用,它验证了一个有趣的假设:system prompt 的”灵魂”如果足够清晰,AI 就能在一个全新的领域里表现出令人信服的专业感。

本期素材来自 AI Builder Space 社群讨论与公开 AI 行业信息的交叉验证。

本文由AI综合领域调研和微信群聊自动生成。请注意甄别幻觉。

订阅本 newsletter：yage-ai.kit.com

鸭哥每日AI要闻

[鸭哥 AI 手记] 2026-02-24

当 AI 能同时看到代码和数据

最佳实践正在收敛

AI 需要看门狗,不是更多的信任

也值得知道

[鸭哥 AI 手记] 2026-03-02

[鸭哥 AI 手记] 2026-03-01

[鸭哥 AI 手记] 2026-02-28