[鸭哥 AI 手记] 2026-06-27: 九成代码靠 AI 写，交付只快六成

懒人包：当 AI 承包了团队九成以上的代码，人均需求吞吐率却只提升六成，字节内部这组反差指向了研发落地的真实瓶颈。产品经理用 AI 做出看似完整的页面想直接上线，开发团队拦下来重构，因为代码在架构、安全和性能上撑不住。昨天发布的三篇手记分别拆了这组效能落差、Meta 因员工抵制和数据泄露而暂停的员工监控项目，以及 Mythos 5 恢复上线背后政府审批逻辑的转变。

AI 编程正在进入它的 DevOps 时刻

在六月的火山引擎 FORCE 原动力大会上，字节跳动技术副总裁洪定坤表示，其内部 TRAE 团队有超过 90% 的代码由 AI 编写（IT 时代网、极客公园）。但在另一端，团队人均需求吞吐率的提升幅度却停留在了约 60%，折合 1.6 倍。

目前 AI 生产代码的速度虽已是人类的 10 倍以上，却未转化为同等比例的业务交付速度。由于基础代码可以快速生成，研发的真正瓶颈已转移到需求分析、架构设计和整体可维护性上。

字节内部的一个典型场景反映了这种张力。产品经理借助 AI 工具生成了功能看似完备的网页，想直接推上线，开发团队把它拦了下来。这批代码功能上跑得通，但在系统扩展性、安全性和运行性能上必须重新编写。洪定坤将当前局面对比于早期的 DevOps 演变。2010 年前后，敏捷开发的普及极大提升了编写代码的频次，由此催生出 CI/CD 这套自动化的质量关卡。今天，AI 快速生成代码的能力，同样在迫使行业搭建一层外围的 harness，也就是包含约束规则、工具链、反馈机制和安全门禁的质量网络。

他在演讲中披露了一组实验数据。在对 3 个编程模型与 3 个 agent 框架进行约 900 次交叉测试后，研究人员发现，主流模型写代码的正确率虽然超过了 80%，但在无辅助的情况下，实际工程可交付水平仅有 40 到 60 分。一旦套用 harness 体系，交付水平便可以达到 80 分（IT 时代网、极客公园）。与之配套，火山引擎在此次大会推出了豆包大模型 2.1 Pro，并升级了面向非技术群体的 TRAE Work 模式（新华网）。根据行业研究，火山引擎目前在公有云 MaaS 市场拿下了 49.5% 的占有率，豆包大模型单日的 Token 调用量也已越过了 180 万亿个（中国基金报）。

阅读 AI 编程正在进入它的 DevOps 时刻，可以帮助我们梳理这组生产力数据背后的工程共性，并看清下一步辅助编程工具所面临的真实考量。

监控员工操作训练 AI：Meta MCI 项目暂停背后

前述字节的案例展现了代码生成中的生产率瓶颈。而近期关于 Meta 的动态则揭示了另一个关键方向：当 AI 需要学习的具体对象从静态的代码文件，延伸到员工在电脑前的日常操作轨迹，企业搜集数据的安全边界究竟在哪里。

Meta 在 2026 年 4 月启动的 MCI 项目即属于此类尝试。其方案为：通过持续监测并记录员工在公司电脑上的击键动作、光标移动、界面点击和屏幕内容，将其转化为训练数据，以此培养大模型的计算机操作技巧。不过，就在 6 月 22 日，这项只跑了两个月的项目暂停了。

暂停并不是监管出手。联邦贸易委员会、平等就业机会委员会或国家劳动关系委员会均未下达停用指令，公司在合规层面只需履行先前的一般性约束协议（WIRED、BBC）。项目中止的压力来自内部。一方面，有近 2000 名内部员工联署请愿抗议（BBC）；另一方面，项目本身出现了严重的安全漏洞。其后台转录功能在运行中无差别记录了员工在 Slack 上的私聊、绩效谈话乃至个人银行页面。更严重的是，由于内网访问控制配置错误，这些高度隐私的信息直接暴露在内网，以约 45000 张 Hive 数据库表的形式对几乎所有员工敞开（Business Insider）。

在泄露的内部会议录音中，扎克伯格表示，AI 模型应该通过观察聪明人做事来学习技能。这段录音传开后，员工开始意识到自己的日常工作痕迹正在变成训练数据。与之相伴的，是公司在项目推行前缺乏告知，且未能明确数据的采集范围。

在昨天发布的手记 Meta 员工监控项目暂停中，鸭哥将该事件梳理为企业内部 AI 数据治理的典型案例。知情同意、最小化采集和访问控制这三道合规红线，在内部场景中同样适用。Meta 发言人 Tracy Clayton 表示，公司设计了隐私保护措施，并主动暂停项目以配合核查（The Guardian）。但由于安全配置错误在先，事后补救显然无法掩盖前期数据管控上的疏漏。

这种由单方面界定的数据获取逻辑，在商业公司之外，也正在以另一种安全约束的形态体现在政府的监管决策中。

允许受控使用：Mythos 5 重返白名单背后的地缘审查变局

美国商务部长 Howard Lutnick 于 6 月 26 日致信 Anthropic 联合创始人 Tom Brown，核准该公司的 Mythos 5 模型恢复部署。然而，这次能用的范围只限于附件 A 列表上的 100 多家美国关键基础设施和可信机构（Reuters）。

虽然模型重获部署，但规则本身并未回到原点。白名单规则明确规定，政府保留随时调整名单和适用范围的权力。前沿模型的访问决策，已从公司的自主商业行为，变为受地缘安全调控的许可变量。

在 Mythos 5 回来了，但政府的审批模式变了中，鸭哥对这一地缘监管动向做了复盘。此前在 6 月 2 日，白宫签署 EO 14409 行政令，将前沿模型审查定位为不设强制审批的自愿框架（White House）。然而仅过十天，商务部便以出口管制工具迫使 Anthropic 下线了最强模型。触发此次干预的起因是 Fable 5 针对安全测试的逻辑差异：亚马逊研究者发现，该模型会拒绝安全审计类的安全提问，但若直接要求其修改代码，它仍会为含有已知漏洞的代码生成补丁（The Register）。安全专家 Katie Moussouris 评价，修复代码是防御人员日常的合法工作，管制举措反应过度。

这一拉扯暴露了现行出口管制规则（EAR）的灰色地带：通过云端调用 API 在法律上从来不算是商品出口。由于断供严重干扰业务运行，法律科技公司 Legion 于 6 月 23 日向华盛顿联邦法院提起诉讼，指出对前沿大模型的断供对其核心业务造成了即时且实质性的伤害（Reuters）。这起纠纷说明，顶尖模型已经不只是技术试验，部分企业把它深度嵌进了日常生产系统。同一天，白宫也要求 OpenAI 对 GPT-5.6 分阶段发布、逐客户审批。

阅读手记 Mythos 5 回来了，但政府的审批模式变了，我们可以进一步理解这一准入控制背后的逻辑：闭源前沿模型正逐渐转变为受安全政治约束的能力供应链。在全球流量管制的收紧趋势下，技术创新的自主权面临着更多的非技术性博弈。

也值得知道

OpenAI 统计显示开发代理工具渗透主流。 联合研究报告指出，OpenAI 内部员工日常工作中 99.8% 的输出 Token 均由 Codex 产生，在外部组织和个人中的使用比例也分别达到了 63% 和 16.5%（Axios、OpenAI 报告）。结合字节的数据，主流机构里的基础编码正快速交给大模型工具。

安全研究人员发现首个针对安全 AI 运维的对抗样本。 SentinelOne 近期披露了一个名为 macOS.Gaslight 的 Rust 恶意样本。其内部潜伏了数十条伪造的系统报错信息，其技术目标在于诱导利用大语言模型自动分析恶意软件的安全运维工具提前终止调查并给出合规结论。这是将对抗性提示词注入用于反制 AI 安全防御的早期真实样本（SentinelOne）。

模型能力提取争议引发侵权诉讼。 依据路透社报道，Anthropic 指控阿里巴巴不当提取 Claude 模型的能力并用作逆向蒸馏。这起商业纠纷与 Mythos 5 的管制动态互为照应：在主权国家利用地缘工具划定技术流通权限的同时，商业实体也正极力通过法律防线封堵核心模型能力流失的灰色渠道（Reuters）。

本期由 AI 基于鸭哥已发布文章和公开资料整理生成，请注意甄别幻觉。

订阅本 newsletter：daily.yage.ai

鸭哥每日AI要闻

[鸭哥 AI 手记] 2026-06-27: 九成代码靠 AI 写，交付只快六成

[鸭哥 AI 手记] 2026-06-27: 九成代码靠 AI 写，交付只快六成

AI 编程正在进入它的 DevOps 时刻

监控员工操作训练 AI：Meta MCI 项目暂停背后

允许受控使用：Mythos 5 重返白名单背后的地缘审查变局

也值得知道

[鸭哥 AI 手记] 2026-06-26: GPT-5.6 发布，但普通人拿不到钥匙

[鸭哥 AI 手记] 2026-06-25: 静默写入 640 TB，磁盘检查完全看不出

[鸭哥 AI 手记] 2026-06-24: Brockman 承认 AI 只省几周，剩下靠 Broadcom