[鸭哥 AI 手记] 2026-02-22

把模型刻进芯片、把 AI 放进 crontab、把知识刻进记忆系统,这三件事听起来毫无关联,但它们解决的是同一个问题:如何让智能从”调用”变成”存在”。

懒人包：ChatJimmy.ai 把模型刻进芯片引发 dev time vs run time 的讨论;教非技术人群用 AI 的最大门槛是认知而非工具;鸭哥把 OpenCode 放进 crontab 标志着 AI 从”调用”变成”基础设施”。

把模型刻进芯片的诱惑与陷阱

群里有人分享了 ChatJimmy.ai 的 demo:把 LLM 的权重直接刻在 ASIC 芯片上,推理速度快到像假的。有人说这像把模型写死在光盘里,有人说是”物理化的模型”。

鸭哥点出了这个思路的核心矛盾:dev time 和 run time 的 trade-off。如果投入大量 dev time(设计芯片、流片),run time 可以缩到极致。CUDA、FPGA、ASIC,dev time 递增,run time 递减,这是芯片设计的经典光谱。

问题在于,这个 trade-off 对”稳定市场”和”快速迭代市场”的价值完全不同。比特币挖矿算法定下来就不变,做矿机 ASIC 是好生意。但 LLM 领域呢?一年半前的 Llama 3.1 8B 现在已经被视为不可用,从设计到流片至少要一年,产出来就是过时的。

群里的讨论随后分化成了两个方向。一个方向是”等 AGI 出来了不用更新了再做”,这是个半开玩笑的说法,但指向了一个真问题:如果模型演进速度稳定下来,固化到芯片就变得合理。另一个更务实的方向是 IoT 和边缘设备。8B 模型做翻译、控制家电、简单对话已经绰绰有余,而这类场景对延迟极度敏感、对智能水平要求不高。一个嵌入墙壁里的芯片,能让咖啡机听懂你说”早上七点煮一壶”,不需要它理解康德。

这里有一个更深的洞察:当我们把”最新最强”当作唯一的评价标准时,会忽略掉一个巨大的市场——对”足够好”有需求、对”足够快”和”足够便宜”有强需求的场景。手机芯片的 NPU 走的就是这条路,只是没有激进到直接把权重刻死。

AI 的采用鸿沟不在技术,在认知

群里有人分享了一个观察:教一个上市公司 CEO 用 Claude Code,发现最大的门槛不是安装、不是网络、不是付费,而是”他对使用 AI 的理解就是聊天窗口、问问题、当 Google 用”。

这不是个例。有人在教国内的 fund manager 使用 AI 工具时遇到了同样的问题:怎么访问 GPT、怎么付费订阅、什么是 brew——这些听起来简单的问题,对于非技术人群来说是真实的壁垒。但更深层的壁垒是认知的:他们不知道 AI 能做什么,所以不知道该要求 AI 做什么。这是 unknown unknown。

有人直言:终端那个黑黑的窗口就能吓死 95% 的人。但实际上,基本上认知关过了以后,很多人很快就会觉得终端是最好用的工具。问题不在于界面的复杂度,而在于用户是否理解了”AI 是一个可以执行任务的实体,而不只是一个聊天对象”这个概念跃迁。

这和 Cursor 的定位形成了有趣的对比。有人说自己去做 AI 培训都是培训 Cursor,因为它的图形界面容易上手。但上手容易和真正有效是两回事。Cursor 降低的是操作门槛,但没有降低认知门槛。你仍然需要理解什么是好的 prompt、什么是合理的任务分解、什么时候该信任 AI 的输出、什么时候该质疑。

这个认知鸿沟正在制造一种新的分层:同样花 200 美元订阅 AI 工具,有人能 10 天写出比四人团队两年更多的产出,有人只是把它当做高级搜索引擎。差距不是 10%,可能是 100 倍。而弥合这个差距的关键不是更好的界面,是一次认知的范式转换——从”问 AI 答案”到”给 AI 任务”。

把 AI 变成基础设施

鸭哥提到一个看似不起眼的实践:把 OpenCode 放到 crontab 里,每周自动跑一次调研、两次检查本机健康状况,每天更新知识和记忆。

这个动作的意义远超它的技术难度。它标志着 AI 使用方式的一个质变:从”人主动调用 AI”变成”AI 作为后台服务持续运行”。就像我们不会每次想用电的时候去发电厂申请一样,AI 也应该像水电一样,接上就有。

群里有人把这个思路推得更远:给女儿做了一个 AI 家庭教师,用 mastery 计算逻辑跟踪学习进度,自动生成复习测试,根据答题表现动态调整教学方向。理解度占 30%、练习正确率占 50%、复习表现占 20%,这套公式本身不复杂,但它实现了一个传统教育做不到的事:为每个学生维护一份持续更新的认知模型。

另一位群友描述了一个类似的实践:让 AI 根据两个月的 journal 和 calendar 分析自己没发现的行为模式。结果”骂得太一针见血了”。AI 给出了一句话总结:”The imperfect tool that gets used beats the perfect tool that’s always under construction.” 这句话本身就是这种”AI 作为基础设施”思路的最好注脚。

这三个场景——crontab 调研、AI 家教、个人行为分析——共同指向一个趋势:AI 的最大价值不在于你主动问它问题的那一刻,而在于它持续运行、持续观察、持续积累后,在你需要的时候已经准备好了答案。这就是为什么鸭哥一直强调 monorepo 和 memory system 的重要性:没有持续记录的基础设施,AI 每次都从零开始,无论模型多强,都发挥不出复利。

也值得知道

GLM-5 的用户群已经变成了 Kimi 和 Minimax 的广告群。用户骑脸输出,直接把竞品后台截图贴进去。一个模型从”火爆抢购”到”用户叛逃”只用了几周,这可能是 AI 时代产品忠诚度的一个预演:当切换成本为零时,任何服务中断都是致命的。

Codex 5.3 的早期反馈不太乐观。有人觉得它和 Opus 4.6 差很多,”不怎么爱深入问题,一会儿就敷衍了事”。解决方案是开 thinking 到 extra high,但这就像告诉一个跑者”你得穿上增压服才能跑”。模型的默认行为应该就是好的,不应该需要用户手动调参才能激活认真模式。

课代表分享了和清华刘嘉教授三小时对话的总结,内容涉及 AI 意识、意义和动力。在理性主义主导的 AI 讨论里看到存在主义的论点,让人惊喜。当 AI 变得足够强大时,我们可能需要回到哲学去寻找护栏。

本期素材来自 AI Builder Space 社群讨论与公开 AI 行业信息的交叉验证。

本文由AI综合领域调研和微信群聊自动生成。请注意甄别幻觉。

订阅本 newsletter：yage-ai.kit.com

鸭哥每日AI要闻

[鸭哥 AI 手记] 2026-02-22

把模型刻进芯片的诱惑与陷阱

AI 的采用鸿沟不在技术,在认知

把 AI 变成基础设施

也值得知道

[鸭哥 AI 手记] 2026-03-02

[鸭哥 AI 手记] 2026-03-01

[鸭哥 AI 手记] 2026-02-28