Skip to content
Synapse
Go back

Claude Code 的架构、Claude Co-work 与工程师的未来

原文:Claude Code Founder on Architecture, Co-work & the Future of Engineers


一、Claude Code 的技术架构

1、极简核心,安全是复杂度的来源

Claude Code 的产品架构非常简单:一个核心 query loop(查询循环)加上一组工具。Boris 说他们持续在删工具、加工具,几乎从不固化。真正复杂的部分是安全层——不是产品本身,而是确保每一个动作都有人类在回路(human-in-the-loop,即每次关键操作需用户确认)中的机制。

权限系统从 2024 年 9 月第一个内部版本就已存在:每次模型要执行需要权限的命令,用户可以选择”只运行一次”、“本次会话允许”或”永久允许”。当时内部安全团队对”让模型直接运行 bash 命令”有很大阻力,这个权限提示机制是与 Anthropic 联合创始人 Ben Mann 一起头脑风暴出来的——不确定时就问人类。

2、RAG 的放弃与 agentic search 的胜出

早期 Claude Code 尝试过本地向量数据库做检索(RAG——Retrieval-Augmented Generation,检索增强生成,即把文档预先向量化存储,查询时先检索再生成),但发现了几个根本问题:代码索引会和实际代码漂移脱节(刚写的函数还没被索引);权限管理复杂;隐私边界难以保障。

最终所有方案都输给了 agentic search——直接让模型用 globgrep 这类工具自主搜索。Boris 把这归功于 Instagram 的经验:在 Meta 的代码库里”点击跳转定义”经常失效,工程师习惯用全局索引搜函数名加括号,这个模式被直接移植到了模型上。

3、多层次 prompt injection 防御

以 web fetch 为例,Claude Code 用三层防御抵抗 prompt injection(提示注入,即恶意网页在内容中嵌入指令试图劫持模型行为):第一层是模型对齐——Opus 4.6 是迄今对齐程度最高的模型,内置对 prompt injection 的抵抗;第二层是运行时分类器,检测到疑似注入时直接 block 并让模型重试;第三层是 sub-agent 摘要——用一个子代理先把网页内容总结后再返回主代理,减少暴露面。这是典型的”瑞士奶酪模型”——没有单一完美防线,靠多层叠加降低穿透概率。


二、Claude Co-work:面向非技术用户的代理

1、为什么做 Co-work

Co-work 是 Claude Code 能力向非技术用户的延伸:同一个 Claude agent SDK,但运行在桌面 App 里,配合 Chrome 扩展访问浏览器中的工具(电子表格、Slack、Asana 等)。Boris 自己的用法是每周让 Co-work 扫描项目状态表格,自动在 Slack 给没有填写状态的工程师发消息——整个任务一键完成。

2、安全设计更严格

非技术用户不了解操作系统,一个不当指令就可能删掉家庭照片。Co-work 因此在安全层投入了更多:后端有多层分类器,前端集成了虚拟机和系统级保护,防止意外删除文件。这也是为什么 Co-work 比 Claude Code 本身的安全代码量更大。

3、Chrome 扩展是关键

非技术用户的工具不是 CLI,而是浏览器。Co-work 与 Chrome 扩展深度集成,让代理能操作浏览器标签页中的任意 Web 应用。Boris 说这是 Co-work 最核心的差异化能力。


三、Agent Teams:多代理协作

1、不相关上下文窗口的价值

Boris 介绍了他们内部的一个概念:uncorrelated context windows(不相关上下文窗口)——多个代理各自启动独立的上下文,互不可见彼此的历史。这与在同一个 context 里顺序执行多个任务(correlated)形成对比。

实验发现:对于复杂任务,让多个独立代理并行尝试,结果质量普遍优于单一代理加长上下文。这本质上是一种 test-time compute(推理时计算量增加),用更多 token 换更好结果。Plugins 功能就完全由 swarm(多代理群组)构建。

2、Opus 4.6 让它真正 work

Agent Teams 内部实验从 2024 年 9 月/10 月就开始了,但直到 Opus 4.6 发布后才感觉”点击了”——模型真正学会了如何分配和协调子任务。Boris 描述了代理之间互相讨论的场景,“非常有人情味”。现在 Agent Teams 仍是 research preview,因为它消耗大量 token,不适合所有任务。


四、工程师的未来:印刷机类比

1、scribes 与程序员的平行

Boris 用印刷机类比来描述当下的处境:中世纪欧洲识字率不足 1%,scribes(抄书吏)是极少数能写字的精英,为贵族服务。印刷机出现后,印刷品成本在 30-50 年内下降约 100 倍,印刷品数量在百年内增加约 10,000 倍,最终全球识字率上升到 70%——但这花了 200-300 年。

Scribes 并没有消失,他们变成了作家和作者。整个文字市场的规模扩张,创造了过去根本不存在的职业。Boris 认为软件工程师也在经历同样的转型。

2、被淘汰的技能与被强化的技能

Boris 认为可以放弃的:关于代码风格、语言选择、框架之争的强烈执念——模型可以用任何语言写,也可以随时重写,这些争论已经不重要了。

值得强化的技能:

3、Anthropic 内部的工作方式

Anthropic 没有固定的职位头衔——所有人都是”Member of Technical Staff”,因为工作本质都是探索性的、泛化的。设计师写代码,财务人员用 Claude Code 构建工具,销售团队的 Co-work 使用率也在快速增长。Boris 每天发出 20-30 个 pull request,没有手动写过一行代码。


核心归纳

Q1: Claude Code 为什么放弃 RAG 改用 agentic search?

Q2: Agent Teams 的核心原理是什么?

Q3: 工程师在 AI 时代应该如何定位自己?



相关内容

上一篇
Palantir 的 Ontology-Oriented 开发范式:为什么企业 AI 的瓶颈不在模型,在本体
下一篇
Palantir 深度分析:为什么贵得离谱却仍值得持有