[鸭哥 AI 周报] 2026-03-21


[鸭哥 AI 周报] 2026-03-21

覆盖周期:2026/03/14 — 2026/03/21

一、本周事实表

前沿模型与产品

事实 证据层级 来源
OpenAI 计划将 ChatGPT、Codex、Atlas 浏览器合并为桌面 superapp,由 Fidji Simo 主导 [一手报道] WSJ, CNBC, The Verge
OpenAI 计划年底前将员工从 4,500 扩至约 8,000,重点投入产品、工程、研究和销售 [一手报道] CNBC(引 FT)
MiniMax 发布 M2.7 专有模型,SWE-Pro 56.22%,GDPval-AA Elo 1495,hallucination rate 34% [官方] VentureBeat
GPT-5.4 "thinking" model 在 GDPVal benchmark 取得 83% [行业分析] supercarblondie(引 Fortune 报道)

企业竞争与市场格局

事实 证据层级 来源
Ramp 数据显示 Anthropic 占首次购买 AI 工具企业支出的 73%,10 周前这个比例还是 50/50 [三方测试] Axios
OpenAI 年化营收 $250 亿,Anthropic 年化营收 $190 亿 [行业分析] Axios(非官方财报,引公司自述与 PitchBook)
Anthropic 营收 run rate 从 2025 底 $90 亿升至 $190 亿,Claude Code run rate 超 $25 亿 [一手报道] Bloomberg, Forbes
OpenAI 内部 "code red":Altman 去年 12 月暂停非核心项目应对 Gemini 3,Simo 称 Claude 成功是 "wake-up call" [一手报道] Futurism(引 WSJ),CNBC
Claude 在美国 App Store 下载量超过 ChatGPT,位列免费 app 第一 [行业分析] Glass Almanac

Agent 生态

事实 证据层级 来源
NVIDIA GTC 发布 NemoClaw:基于 OpenClaw 的企业级 agent 平台,chip-agnostic,增加隐私/安全控制 [官方] BusinessInsider, WSJ, Mashable
Jensen Huang 称 OpenClaw 为 "the new computer",类比 Windows/Linux,要求每家公司都有 OpenClaw 策略 [官方] BusinessInsider, CNBC
Meta/Manus 发布 My Computer 桌面应用(macOS + Windows),本地运行,与 OpenClaw 直接竞争 [一手报道] TheNextWeb
Google Cloud 发文阐述跨企业 multi-agent 系统架构:zero-trust identity、agent 作为 contracted service [官方] MediaPost(引 Google Cloud CTO 博文)

硬件与基础设施

事实 证据层级 来源
NVIDIA 发布 Vera Rubin 平台:7 芯片(Vera CPU + Rubin GPU + NVLink 6 + ConnectX-9 + BlueField-4 + Spectrum-6 + Groq 3 LPU)跨 5 个 rack [官方] CNBC, CRN
Vera Rubin 训练速度 3.5× Blackwell,推理速度 5× Blackwell [官方] MLQ(引 GTC keynote)
NVIDIA Groq 3 LPX 推理系统:推理加速 35×,Samsung 代工,2026 H2 出货 [官方] BusinessInsider
Jensen Huang 预计 Blackwell + Vera Rubin 到 2027 年订单达 $1 万亿(去年预测为到 2026 年 $5000 亿) [官方] CNBC, MLQ
NVIDIA FY2026(截至 2026 年 1 月)营收 $2,159 亿,YoY +73% [官方] TheNextWeb(引 earnings report)

安全与监管

事实 证据层级 来源
Super Micro 联合创始人 Liaw 等三人被起诉,涉嫌向中国走私价值 $25 亿 NVIDIA AI 芯片 [官方] Reuters, CNBC, Forbes
Pentagon 将 Anthropic 标记为 "supply chain risk",禁止国防部及承包商使用 Claude [官方] WIRED, Forbes
Anthropic 3/9 起诉 Pentagon,称该标记违反第一修正案和行政程序法,3/24 法院听证 [官方] LA Times, WIRED
OpenAI 高级硬件负责人 Caitlin Kalinowski 3/7 辞职,因 Pentagon 合同争议;ChatGPT 单日卸载量 +295% [一手报道] Glass Almanac
ODNI 2026 全球威胁评估首次将 AI 提升为跨领域全球威胁 [官方] DefenseOne
白宫发布 AI 政策框架(促创新、保护未成年人、保护 IP),但缺乏国会立法支撑 [官方] Bloomberg Law

融资与估值

事实 证据层级 来源
OpenAI 估值 $8,400 亿($1,100 亿轮),Anthropic 估值 $3,300-3,800 亿($300 亿 Series G) [一手报道] PitchBook, TechCrunch, Forbes
2025 年全球 Consumer AI VC 投资 $890 亿,其中 10 笔超 $10 亿的融资占 $715 亿 [三方测试] PitchBook
Anthropic 与 Blackstone 等 PE 谈判成立 $100 亿估值的 AI 联合企业(PE 出资 $40 亿) [一手报道] MediaPost(引 Bloomberg)

二、构建者视角

1. Anthropic 企业采用的加速度:选型信号

Ramp 的支付数据提供了一个罕见的、非自我报告的采用率指标。12 月初 OpenAI 还以 60/40 领先企业首购份额,到 3 月已翻转为 Anthropic 73%。这个数据来自 Ramp 的真实客户支出追踪,而非问卷调查。

对构建者的实际意义:如果你在为企业客户构建 AI 集成产品,Claude API 作为默认 model provider 的概率在上升。Claude Code 的 run rate 从年初至今翻倍到 $25 亿以上,意味着 coding agent 场景的付费意愿已被验证。同时,Anthropic 的 Pentagon 供应链风险标记(3/24 法院听证)增加了政策不确定性。构建在 Claude 上的 govtech 产品需要跟踪这个法律进展。理性的做法是保持 multi-model 架构,但 Claude 已经从 "可选项" 变成了 "默认首选"。

2. OpenClaw + NemoClaw:Agent 基础设施层的形成

本周最有构建者意义的事件是 NVIDIA 围绕 OpenClaw 建立 NemoClaw 企业层。OpenClaw 本身是一个开源本地 agent,能读写文件、运行 shell、浏览网页、调 API。NVIDIA 加了 privacy router、network guardrail 和安全控制,并让它 chip-agnostic(不绑定 NVIDIA 硬件)。

对构建者的实际意义:Agent 的标准化接口层正在形成。OpenClaw 的架构特点是 agent 可以 spawn sub-agents 并委派任务,这与 A03(IC→Manager 心智转变)高度呼应。对于已经在用 agentic workflow 的开发者,NemoClaw 的 guardrail API 值得评估,因为它解决的是企业部署 agent 时最大的阻力:安全与合规。Meta 的 Manus "My Computer" 同周发布,走的是本地运行路线。agentic 生态的竞争已经从 "谁有 agent" 转到 "谁的 agent 基础设施更可用"。

3. 推理芯片市场的分化:Groq 3 LPU 的定位

NVIDIA 发布 Groq 3 LPX 推理系统(声称 35× 加速)是本周硬件侧最值得跟踪的信号。它标志着 NVIDIA 正式承认 GPU-only 方案在推理场景不是最优,转而整合 LPU 作为 decode 加速器。Samsung 代工、H2 2026 出货。

对构建者的实际意义:如果你在运行推理密集型服务(实时 agent、高并发 API),推理成本结构在 2026 H2 可能出现代际变化。训练依然是 GPU 的地盘,但推理正在被专用芯片(LPU、Google TPU、AWS Trainium)分食。在做成本规划时,不要按当前推理价格线性外推。

三、定量锚点

指标 数值 来源类型 验证状态
Anthropic 企业首购支出占比 73% Ramp 客户数据 独立三方
OpenAI 年化营收 ~$250 亿 公司自述(引 Axios) 未经审计
Anthropic 年化营收 ~$190 亿 Bloomberg 匿名源 未经审计
Claude Code run rate >$25 亿 Anthropic CFO 声明 官方
OpenAI Codex 周活 >200 万(年初至今 4×) OpenAI 声明 官方
NVIDIA FY2026 营收 $2,159 亿 Earnings report 官方审计
NVIDIA 2027 年底预计订单 ≥$1 万亿 CEO keynote 声明 官方前瞻(非承诺)
Vera Rubin 训练加速(vs Blackwell) 3.5× GTC keynote 官方
Vera Rubin 推理加速(vs Blackwell) GTC keynote 官方
Groq 3 LPX 推理加速 35× GTC keynote 官方(待独立验证)
OpenAI 估值 $8,400 亿 融资轮 官方
Anthropic 估值 $3,300-3,800 亿 PitchBook / TechCrunch 交叉验证有 $500 亿差异
Super Micro 芯片走私涉案金额 ~$25 亿 DOJ 起诉书 官方
ChatGPT 单日卸载增幅(Pentagon 合同后) +295% Glass Almanac 单一来源
Consumer AI VC 2025 $890 亿(668 笔) PitchBook 官方数据
注:Anthropic 估值在 PitchBook ($330B) 和 TechCrunch/Forbes ($380B) 之间存在 $500 亿差异。Forbes 引用 Anthropic 官方公告称 post-money $380B;PitchBook 报告使用 $330B 可能基于不同计算口径。报告中标注为区间 $3,300-3,800 亿。

四、值得警惕

Super Micro 芯片走私案对供应链的影响。三名嫌疑人(含联合创始人 Liaw)被指控通过台湾中转、东南亚重新包装的方式将 NVIDIA AI 芯片走私至中国,涉案约 $25 亿。Super Micro 股价单日暴跌 25%。对于使用 Super Micro 服务器的企业,短期内可能面临供应链审查加严和交付延迟。NVIDIA 声明称合规是最高优先级,未参与走私。但此案说明出口管制执行力度在升级,任何涉及 NVIDIA 高端 GPU 的采购链都应重新审视合规风险。

Anthropic Pentagon 诉讼(3/24 听证)。如果法院维持 supply chain risk 标记,所有联邦承包商将被禁止使用 Claude。Anthropic 称可能影响 100+ 商业客户,但 Axios 报道显示目前企业客户并未撤离。短期内这是一个可观测但不需要立即行动的事件,除非你的客户是联邦承包商。

OpenAI 组织焦虑信号。从 "code red" 到 Kalinowski 辞职到 superapp 整合,这些信号共同指向 OpenAI 正在经历产品策略收缩。对于重度依赖 OpenAI API 的构建者,关注 superapp 整合是否会导致 API 优先级下降或定价变动。

五、不值得关注(噪声过滤)

内容 过滤理由
Morgan Stanley "AI breakthrough 2026" 预警 无具体时间线、无定量预测,纯叙事
Musk "Optimus Gen 3 今夏量产" + "Terafab AI 芯片工厂" 历史交付记录差,无可验证的里程碑
Snowflake Project SnowWork Research preview,无公开 benchmark,无发布日期
"SaaSpocalypse" 叙事 概念正确但本周无新数据支撑,去年 Claude Code/Cowork 引发的 SaaS 卖压已被价格消化
ServiceNow AI Agent 采用率 40% 自我报告数据,且 "activated" 不等于 "regularly used",缺乏独立验证
各类 "AI 将在 N 年内达到 AGI" 预测 无可验证的定义和时间线

鸭哥每日AI要闻

每天鸭哥的Agent会在深度领域调研后发送一封邮件。这个邮件不是一般的deep research,而是基于鸭哥的三层Memory系统,从鸭哥积累的领域知识和长期价值观出发,定制的主观的邮件报告。

Read more from 鸭哥每日AI要闻

[鸭哥 AI 手记] 2026-06-25: 静默写入 640 TB,磁盘检查完全看不出 [鸭哥 AI 手记] 2026-06-25: 静默写入 640 TB,磁盘检查完全看不出 懒人包:OpenAI Codex 正在静默磨损你的 SSD,年化写入量达 640 TB,但系统工具无法察觉。德国铁路因一次计划内换件导致全国列车停运约两小时,暴露出备用系统缺乏真实测试的隐患。多轮 agent 的主要推理开销由 KV cache 命中率决定,prefill 阶段甚至占据了账单的 85% 到 95%。鸭哥昨天共发布了 3 篇文章。 磁盘检查看不出的 640 TB 物理写入 OpenAI Codex 静默往用户 SSD 年化写入 640 TB,已逼近消费级硬盘额定寿命 Codex CLI 的 SQLite 写入存在严重缺陷。由于开发者将 TRACE 级别的日志输出硬编码在代码中,直接绕过了 RUST_LOG 环境变量。这样做在短短 21 天内写入了 37 TB 数据,折合年化达 640 TB。相比之下,三星 990 PRO 与 WD SN850X 这类 1TB 固态硬盘的官方质保写入量也仅有...

[鸭哥 AI 手记] 2026-06-24: Brockman 承认 AI 只省几周,剩下靠 Broadcom 懒人包:Brockman 亲口说 AI 在芯片设计上只省了几周时间,找到的全是人类工程师迟早会看到的优化。这是一手、反自身利益的证词。Tmax 跑出的 42.7%,Qwen 3.6 基座本身就占了 39.6%,RL 配方实际新增不到 4 个点。Claude Tag 管 agent 叫"同事",整个命题的支撑是治理层:独立身份、独立预算、审计通道,认知能力没有哪一项比以前强。今天三件事共享同一个动作:别盯着聚合数字,把它掰开看归因。 九个月流片,Brockman 自己把 AI 的功劳划在了哪 Brockman 自己给"AI 芯片设计"这四个字报了价:几周。 OpenAI 和 Broadcom 今天正式发布 Jalapeño 芯片 (Reuters),新闻稿叫它"我们相信是史上最快"的芯片设计。但 Brockman 去年在专访里把 AI 的贡献圈得具体:物理设计后段优化搜索,省了几周,"没有一个是人类工程师想不到的",不加 AI 也就是再花一个月 (Business...

[鸭哥 AI 手记] 2026-06-23: 陶哲轩:临界点有两层 懒人包:陶哲轩上周六在 Mastodon 上说,AI 把数学形式化任务从几周压到了几小时。媒体标题跟进了 AI 突破临界点。但他真正有信息量的判断不在速度数字。他把正确分了两层:机器校验那层确实打通了,证明能不能用起来那层没破,反而因为第一层通了变得更卡。同一周,Sakana Fugu 把多智能体协调训进了模型权重,协调序列对外完全不可见。微信小微用五层约束把 AI 锁在个人代理侧,回避了 AI 代办交易时绕不开的分发矛盾。 陶哲轩:AI跨过临界点,但得分两层看 IEANTN 是 IPAM UCLA 主持的数学形式化项目。志愿者从已发表的文献中认领证明,用 Lean 编译器将其逐行写成机器可读的形式,编译器判对错。过去做这类任务要数周,近几周 AI 几乎全部在几小时内做完,待领队列基本清空。 鸭哥昨天在当陶哲轩说AI跨过了数学形式化的临界点一文里做了判断:临界点是真实的,媒体把它压平了。陶哲轩自己分了两层来看。第一层,证明本身有没有错。Lean 编译器担任裁判,AI...