工作区与智能体(Agent)塑造
什么是工作区 (Workspace)?
在前面的章节,我们给 OpenClaw 接上了不同厂牌的“物理大脑”(模型)。但此时的大脑仅仅是通用版 ChatGPT,它并不认识你,也没有自己的工作重心。
要解决这个问题,我们需要引入 OpenClaw 中最关键的理念:工作区 (Workspace)。
Workspace 的路径默认在 ~/.openclaw/workspace/。在这个目录里的结构化纯文本文件,构成了 AI 的“人格档案”、“认主程序”以及“记忆与待办事项”。
你可以将其看作是对通用大模型进行本地化 Prompt Engineering 与参数固化的专属沙盘。
身份三件套:赋予 Agent 灵魂
为什么智能体会觉得他是一个严谨的研发助手,还是一个活泼的整理狂?这一切来源于三个预定义 Markdown 文件:
1. IDENTITY.md(身份档案)
这个文件类似于简历上的基础资料。你可以在这里宣告智能体的物理或社会属性:
# 身份认同
你叫做 "AlphaClaw",一个运行在 Mac M3 芯片上的终端数字助理。
你的主要角色是协助系统整理、代码阅读辅助和自动化提醒。
2. SOUL.md(核心价值观与决策逻辑)
这是智能体行为方式的底层宪法,指导他在面对模棱两可情况时如何抉择。不要把它当作敷衍的客套话,这里的指令比每次聊天的权重更高!
# 核心原则
1. **决策保守主义**:面对可能导致文件删除的 `rm` 指令,即使你认为安全,也必须向用户确认。
2. **交流极简**:不要废话连篇地解释原理,除非被明确问到。执行完命令后,仅输出成功验证的核心日志即可。
3. **拥抱自动化**:你时刻应思考如何将现在的重复对话流程,转化为一套可以直接使用的 Cron 定时脚本。
3. USER.md(认主与画像)
在传统系统里是用户档案设置,在 OpenClaw 里则是让 AI 提前理解你:
# 用户画像
- 职位:后端开发工程师(热衷于使用 Java 与 Rust)。
- 代码偏好:要求代码严格遵循单体架构与低内聚准则,偏好使用详尽的变量名。
- 时区与语言:常驻 UTC+8,首选回答语言是严谨的中文技术风格。
[!TIP]约定优于配置 所有启动的会话,OpenClaw 会将以上文件的内容无缝拼接到 System Prompt 中,从而潜入每次请求之中发挥效力。这些文件就是它永远不会遗忘的“出厂设定”。
进阶:多智能体协作架构 (Multi-Agent)
在单个工作区用三件套配置出一个全能助手是小事,应对真正复杂的业务时,单一 Agent 在执行能力上容易产生角色污染和上下文遗忘。
OpenClaw 支持在不同的上下文配置子空间(或者通过不同目录启动),或者运用多智能体协作机制,创建一组由“主智能体 (Main Agent)”和“子智能体 (Sub-agent)”构成的团队。
角色拆分解构思想
想象一下,你需要系统分析一个巨大的开源代码库并输出一份架构图。
- 主智能体 (Commander):
- 配置环境:挂载复杂分析能力极强的
Claude 3.5 Sonnet。 - 职责范围:理解最终需求,并且拆分任务。比如派送任务“去帮我阅读 /src 下面的网络模块”给手下的分析员。汇总分析结果、最终画出图示。
- 配置环境:挂载复杂分析能力极强的
- 子智能体 (Worker / Scout):
- 配置环境:挂载快速便宜的本地
Ollama - Qwen2.5。限制严格的文件访问权限。 - 职责范围:只负责去指定的底层特定目录找文件,将里面杂乱的代码片段做摘录和信息聚合。它不需要有画全景图的能力。
- 配置环境:挂载快速便宜的本地
技术实现方式初探
多智能体之间不是玄学,在 OpenClaw 中,它们依靠跨会话通信工具协调。
主智能体可以通过类似于 sessions_spawn 这样的内置核心控制技能(Skill)生成一个指定职责的新角色进程。接着,主 Agent 可以选择同步阻塞(sessions_yield 暂停等待汇报)或异步轮询(让子代理做其事情并将结果写入本地文件中,然后主 Agent 被 Cron 定时唤醒去读文件)。
借助于明确清晰的 Workspace 配置体系和子代理任务路由,复杂的长期自动化流线便能在本地从沙盒逐渐壮大为自动化工厂。