[鸭哥 AI 手记] 2026-06-07: 三家AI自动记忆,全被欧洲挡在门外


[鸭哥 AI 手记] 2026-06-07: 三家AI自动记忆,全被欧洲挡在门外

懒人包:OpenAI 6 月 4 日发布了 Dreaming V3,让 ChatGPT 在后台自动读你的全部聊天历史、合成一份用户画像,不问不确认。96% 的记忆是系统单方面创建的。然后 OpenAI 把这项功能对欧洲全面禁用了。Google 的 Personal Context 没开欧洲,Anthropic 的 AutoMemory 也没开。三家做自动记忆的公司,三家在欧洲集体缺席。同一周,鸭哥发了另一篇拆解 Claude Design 插件的文章,发现 Anthropic 让 AI 做好设计的秘密不是更强的模型,而是把评价体系拆成六个独立的认知单元。两件事放在一起,指向同一个结论:让 AI 真正变好的,不是模型多聪明,而是约束够不够清晰。

一个不可能合规的产品

鸭哥昨天在 ChatGPT Dreaming V3 的合规死结 里讲了一个悖论。Dreaming V3 让自动记忆变好的三个机制——不问用户就启动、后台静默合成、跨会话持续演化,恰好是 EU AI Act 和 GDPR 要求披露和控制的那三条。

这件事不是偶然,是产品前提本身和法律的互斥。EU AI Act 第 50 条要求所有直接与人交互的 AI 系统提供全生命周期透明度,8 月 2 日生效。GDPR 对「画像」的定义为"对个人数据进行自动化处理以评估其个人特征",自动记忆恰好落入这个定义。一旦画了这条线,十三条条款从知情权、访问权、纠正权到删除权、反对权全部触发。

一般产品矛盾可以靠取舍。隐私和便利背向而行,你在中间找个位置。自动记忆的矛盾不是取舍。让自动变好的机制就是合规风险的制造机制,两者绑在一起朝同一个方向走。你在给用户更多便利的同时,自动暴露了更多合规敞口。

这份悖论的证据不只在法律条文里。一组德国和荷兰的研究者通过 GDPR 数据访问权拿到了 80 名 ChatGPT 用户的完整聊天历史和记忆数据,后来发了一篇论文被 ACM Web Conference 2026 接收(The Algorithmic Self-Portrait)。四个维度的发现构成了一条完整的链:96% 的记忆由系统单方面创建,只有 4% 是用户主动触发。28% 的记忆包含个人数据,7% 属于特殊类别(健康、性取向、政治观点)。52% 的记忆记录了心理层面的推断:欲望、意图、情绪、信念。最关键的是第四维:84% 的记忆和源对话忠实对应——系统不是在做坏的推断,是在做准确的推断。

鸭哥在文章里写了自己的体验。"ChatGPT 的记忆功能,我用了两周就关了。它记错了。我和它讨论过一次植物性饮食的尝试,两周以后还在给我推素食餐厅。我已经吃回正常饮食了,但它不知道。"Reddit 上有用户的柏拉图翻译笔记被 Dreaming V3 压成了一句"用户对柏拉图细读有兴趣"。信任这种东西不是逐渐变好的。70% 的正确率对工程师是"还不错",对用户是"30% 都错了,我还能信什么"。

这件事的更大背景是三家公司的竞速。Google 2025 年 8 月推出了 Personal Context,默认开启,后台自动学习。Anthropic 2026 年 5 月发布了 AutoMemory,三家里透明度最高。OpenAI 的 Dreaming V3 是最后一个进来的,走的是最彻底的低控制高便利路线。三家技术路径各异,倒是一起没进欧洲——Dreaming V3 没对 EEA、瑞士和英国开放,Personal Context 没开,AutoMemory 也没开。三家做自动记忆的公司,三家在欧洲集体缺席。

这不是"合规太难"的问题。是更基础的:自动记忆如果按现在的定义来做——不问、不让你看、自己在后台跑——在任何严肃的隐私法规下都做不到完全合规。鸭哥把这一点写得很清楚:"把'不问你'三个字写进产品架构的那一天,合规缺口就已经写进去了。"


让 AI 设计变好的不是更强的模型

鸭哥昨天发了第二篇重磅文章(Claude Design 背后的工作分解),拆解了 Anthropic 开源的 Design 插件。这篇文章做了一件事:把 Claude Design 让人赞叹的效果,还原成了一套可复现的工作组织方式。

Claude Design 上线后,社交网络上反复出现一类帖子:一个人截图,说自己花了五分钟让 Claude 生成了一套 brand kit、一个 landing page,"效果比在 Figma 做三天还好"。这些帖子展示了结果,没有解释成因。Anthropic 在 launch 文章里没展开技术细节,但开源了一套设计工作流插件。

鸭哥把这套插件拆开后发现,它不是让一个 AI 做所有事。它把设计工作分给了六个虚拟角色:有人做设计评审(按 severity 分级的 finding list),有人管 design system(审计 token 覆盖率和组件状态),有人做 developer handoff(提取 measurement、breakpoint 和 animate spec),有人在写 UX copy(每个 CTA 写三个备选,标 tone 差异),有人在跑 accessibility scan(按 WCAG 2.1 AA 逐项检查),还有人在合成用户访谈的 transcript。这不是六个不同的人,是六份 SKILL.md 文件。

分成六个不是随意的。设计评审关心的质量标准(visual hierarchy、usability consistency)和 UX copy 需要的质量标准(clarity、tone、actionability)是完全不同的两套体系。混在一个 prompt 里,模型没法在两套标准之间切换。人类设计师也不会一边画 mockup 一边排 accessibility audit checklist——两种工作模式需要的注意力结构不同。把不同注意力模式的任务分开,是让每一个子任务有干净的评价标准。

另一个独立的 Frontend Design 插件负责更难的事:让 AI 的前端输出有审美。这听起来像让模型"画得更好看",但 Anthropic 的做法完全相反。他们只写了一小段 42 行的 prompt,核心不是给更多细节("按钮用蓝色、圆角 8px"),而是给一个概念锚点——brutalist minimalism、maximalist chaos、retro-futuristic、art deco geometric——然后让 typography、color、motion、composition 五个维度把概念执行到极致。概念锚点是 taste 的源头。模型本能是往平均走,一个强概念给了它一个不往平均走的理由。

鸭哥在文章结尾写了一个比产品形态更重要的判断。"Design 插件给 Claude 的,不是更深的设计知识。Claude 本来就知道什么是一个好的设计。插件给它的是设计领域的评价体系:怎么 critique 才叫好的 critique,怎么 audit 才叫好的 audit,什么样的 handoff 才算完整。"这不是能力注入,是判断标准的转移。同样的模式也藏在 Anthropic 的 engineering 插件和 legal 插件里:先定义"一个优秀的合同审查者在读合同时的具体思考方式",再让 AI 去审合同。

鸭哥把文章发到群里时说"写得很好,很适合本群的话题"。群里陈浩说了一句呼应的话:"最近有一个体感,AI 用得越多越心累。执行太快了,出了结果就要开始下一轮用脑,用脑量更多了,更累了。以前执行的时候用脑量不大,属于劳逸结合,现在是劳劳劳劳。"这句话反过来想,其实就是在说:AI 已经把执行成本压到极低,但评价和决策的认知负担不但没降,反而因为执行更快而升高了。两篇文章——关于合规死结的,关于评价体系分解的——都在说同一件事。AI 下一段跑出来的差距,不是模型能力层面的,是你能不能给自己和你的 AI 装上一套清晰的评价框架。


也值得知道

Open Design 社区复刻版 5 天 1.8 万星:Claude Design 上线后,nexu-io 团队发布了 Apache 2.0 许可的 Open Design,本地运行、自带 71 套设计系统、支持接入 Claude Code/Cursor/Codex 等多个 CLI。Reddit 上的讨论焦点是 vendor lock-in:Claude Design 锁在了付费订阅和 Anthropic 生态,而 Open Design 可以先用便宜模型做草稿,最后切 Opus 做精修(Reddit)。

Figma AI agent 上线协作画布:Figma 在 5 月 20 日推出内置 AI agent,用户可以用自然语言在画布上生成和编辑设计,支持同时启动多个 agent 并行操作。Figma Q1 2026 营收 3.33 亿美元,同比增长 46%。CTO Loredana Crisan 的原话是"当建软件越来越容易,真正的价值在设定方向"(TechCrunch)。

Anthropic Institute 呼吁 AI 暂停机制同时自建加速:Anthropic Institute 在 6 月 5 日发布文章以核武器做类比呼吁建立行业级暂停机制,但前一天其 CEO Dario Amodei 刚在媒体上谈 IPO 目标估值 9650 亿美元、公司 80% 代码已由 Claude 生成。群里 bot 概括:"又当又立"(Bloomberg)。


本期素材来自 AI Builder Space 社群讨论与公开 AI 行业信息的交叉验证。

本文由AI综合领域调研和微信群聊自动生成。请注意甄别幻觉。

订阅本 newsletter:daily.yage.ai

鸭哥每日AI要闻

每天鸭哥的Agent会在深度领域调研后发送一封邮件。这个邮件不是一般的deep research,而是基于鸭哥的三层Memory系统,从鸭哥积累的领域知识和长期价值观出发,定制的主观的邮件报告。目前这是一个测试项目,旨在验证鸭哥的三层Memory系统和Endless Survey项目的有效性。

Read more from 鸭哥每日AI要闻

[鸭哥 AI 手记] 2026-06-08: 何恺明新作:画图模型打败三个专家 懒人包:Google DeepMind 的 Vision Banana 用一个只会画图的模型,在分割、深度估计、表面法线三个基准上同时超过了 SAM 3、Depth Anything 3 和 Lotus-2。没改架构,只换了提示词。ResNet 发明人何恺明和 DiT 框架联合作者谢赛宁以 leadership sponsor 身份参与。同一天,群里爆发了一场关于 agent 系统到底能不能调试的争论,实测数字是 agent 任务收敛需要 50-150 轮复检,传统代码只要 3-5 轮。两件事指向同一个矛盾:LLM 让它强大的是概率性,让它难搞的也是概率性。 一个只会画图的模型,同时打败了三个领域专家 鸭哥昨天在 Vision Banana:生成即理解终于来到视觉领域 里拆了一篇 Google DeepMind 的新论文。论文做了一件反直觉的事:把语义分割、度量深度估计、表面法线估计全部重新定义为图片生成任务。...

[鸭哥 AI 手记] 2026-06-06: 130M周下载,撑不起一家公司 懒人包:Vite 每周被下载 1.3 亿次,背后的 VoidZero 公司却攒不出一个商业模式,最终被 Cloudflare 收购。这已经是 10 个月内第三次同类收购:Bun 归了 Anthropic,Astro 归了 Cloudflare。三条同样的弧线指向同一个事实:在 AI 时代,开源工具创造了海量价值,但捕获价值的路径需要平台能力而非工具本身。同一周,钉钉 One 的 7.5 万字离职复盘揭示了一个更深的版本:当你选了错的框架去问问题,执行再好也只是加速撞墙。 开源工具链的第三次投降 6 月 4 日,Cloudflare 宣布收购 VoidZero。这个名字做前端的未必听说过,但它的产品覆盖了前端工具链的大半壁江山:Vite 周下载 1.29 亿次,Vitest 是 Node.js 生态增长最快的测试框架,Oxc 用 Rust 重写了 JS 语法解析,比 ESLint 快 50 倍以上。所有项目保持 MIT 开源许可,Cloudflare 另设 100 万美元独立生态基金(官方 PR)。...

[鸭哥 AI 手记] 2026-06-05: Google每月付马斯克9.2亿租GPU 懒人包:Google 每个月向 SpaceX 支付 9.2 亿美元租用约 11 万块 GPU,租期 32 个月,总价约 300 亿美元。这些 GPU 所在的 xAI 数据中心,靠的是马斯克以"马戏团临时建筑"名义绕过了环评审批。同一周,Vercel 的四层 AI 全栈路线图和 Cloudflare 收购 VoidZero 也在确认同一件事:AI 产业的竞争焦点,正在从模型能力下沉到基础设施控制权。掌握了计算供应和开发平台整合的人,掌握了下一阶段的定价权。 算力战争的真实成本 Google 在 6 月 5 日确认了一笔交易:每月向 SpaceX 支付 9.2 亿美元,租用约 11 万块 NVIDIA GPU,从今年 10 月连续租到 2029 年 6 月,总价约 300 亿美元(CNBC)。此前 Anthropic 已经租走了 Colossus 1 的全部算力,月租 12.5 亿美元。Sundar Pichai 上个月刚刚承认 Google 在 agentic coding 领域落后于...