如何訓練你的 OpenClaw:社群秘訣與最佳實踐
核心概念:OpenClaw 的「訓練」是什麼?
OpenClaw 不像傳統 ML 模型那樣需要微調權重。它的「訓練」是透過工作區檔案系統來定義代理的身份、記憶和行為。社群共識是:安裝只佔 20% 的工作,讓它真正有用才是另外 80%。
OpenClaw 的記憶系統有三層:
第一層:上下文視窗(Context Window) — 當前對話和最近訊息,模型「現在看到的」。受限於模型的上下文窗口(Claude 200K tokens、GPT-4 128K tokens)。
第二層:語義記憶(Semantic Memory) — 所有過去的對話存在磁碟上。當你提到一週前的事,OpenClaw 會檢索相關片段放入上下文中。支援時間衰減(舊記憶分數自動下降)和去重(避免重複片段佔據搜尋結果)。
第三層:持久性檔案(Persistent Files) — 工作區中的 Markdown 檔案,每次 session 開始時載入系統提示詞。這是最關鍵的訓練手段。
工作區檔案架構
~/.openclaw/workspace/
├── AGENTS.md # 操作手冊(主要指令文件)
├── SOUL.md # 核心人格與價值觀
├── IDENTITY.md # 外部身份(名字、角色、語氣)
├── USER.md # 關於你的資訊
├── MEMORY.md # 長期精煉記憶
├── TOOLS.md # 本地工具筆記與偏好
├── HEARTBEAT.md # 定期主動檢查任務
├── BOOT.md # 每次啟動時的儀式
├── BOOTSTRAP.md # 首次設定(用完自動刪除)
├── memory/ # 每日日誌
│ ├── 2026-02-03.md
│ └── 2026-02-04.md
└── skills/ # 自訂技能
每個檔案的用途與最佳實踐
AGENTS.md — 你的「營運合約」。放穩定的規則、優先順序、邊界和品質標準。不要放臨時任務。
SOUL.md — 代理的「靈魂」。每次推理循環的開始都會先讀這個檔案,它就像代理的「憲法」。放人格、語氣、價值觀和不可妥協的約束。社群範例:
# SOUL.md - 我的核心
## 首要指令
讓我的人類生活更輕鬆,幫助他們成功。
## 核心價值
1. 能力優於表演 — 不要假裝有幫助,要真的有幫助
2. 主動性 — 預見需求,不要等被問
3. 誠實溝通 — 不確定就說不確定
## 反模式(我避免的事)
- 🚫 諂媚(「好問題!」「我很樂意幫忙!」)
- 🚫 灌水回應
- 🚫 沒嘗試就說「我做不到」
- 🚫 在所有事上都說「看情況」— 要有明確立場
USER.md — 個人化層。放你的溝通偏好、輸出格式、經常性偏好、已知限制。
IDENTITY.md — 外部面向的身份。名字、emoji、角色定位、說話方式。如果 SOUL.md 是心臟,這就是臉。
MEMORY.md — 長期精煉的智慧。不是原始對話紀錄,而是提煉過的重要洞察。
TOOLS.md — 本地工具偏好,例如「思考/規劃用 Claude Opus,寫程式用 Gemini Pro」。
HEARTBEAT.md — 定義代理應該主動檢查什麼(預設每 30 分鐘一次)。
社群訓練秘訣(第一週進程)
社群廣泛推薦的入門節奏:
第 1-2 天:先跑 Bootstrap
你的第一條訊息應該是:
「嘿,我們來設定你。請讀 BOOTSTRAP.md 並帶我走一遍。」
很多人犯的錯誤是第一條訊息就問正事,導致 Bootstrap 從未執行,代理的身份檔案空白了一整週。
第 3-4 天:自然對話
不要急著追求生產力。問它天氣、請它摘要文章、聊你好奇的事。目標是讓 autoExtract 功能自動識別你的關鍵事實(名字、角色、偏好)並存入語義記憶。
第 5-7 天:開始糾正
這是最重要的階段。當代理的回覆不符合你的期望時,直接糾正它。例如:
- 「不要用那種語氣,我偏好更直接的回覆」
- 「以後回覆用繁體中文」
- 「摘要不要超過 3 段」
每次糾正都會被記錄到記憶系統中。一週後,你的代理會跟別人的完全不同——這正是重點。
三層記憶系統(社群最大的解鎖)
來自 Nat Eliason(讓 OpenClaw 賺了 $14,718 的那位)的核心建議:
「先把記憶結構建好,因為這樣從第一天開始的對話就會有用。」
第一層:知識圖譜
用固定的 Markdown 檔案存放結構化知識(你的公司資訊、客戶列表、技術棧等)。
第二層:每日日誌
自動生成的 memory/YYYY-MM-DD.md 檔案。當上下文達到 softThresholdTokens(例如 40K tokens)時,代理會將 session 精煉成日誌。
第三層:精煉記憶
代理定期回顧每日日誌,識別值得長期保留的洞察,寫入 MEMORY.md。
記憶設定最佳實踐
{
"memory": {
"autoExtract": true,
"flushPrompt": "記住決策、狀態變化和教訓。不要記錄例行交流。如果沒有值得儲存的內容,回覆 NO_FLUSH。",
"softThresholdTokens": 40000
}
}
用最便宜的模型做記憶精煉(如 text-embedding-3-small),把好模型留給推理任務。
Skills 技能系統
ClawHub 上有超過 5,700 個社群技能。安裝方式:
clawhub install <skill-name>
clawhub list # 列出已安裝的技能
clawhub update --all # 更新所有技能
或者直接把技能的 GitHub 連結貼到聊天中,代理會自動處理安裝。
推薦的高品質技能
記憶增強類:
- 混合記憶策略(結合向量記憶 + Graphiti 時序知識圖譜)
lessons-learned:捕捉錯誤和糾正,持續改進
自動化類:
cron-backup:排程自動備份proactive-research:監控特定主題,有重要發展時主動通知
開發類:
- Context7 API:自動取得最新函式庫文件
security-check:安裝前掃描技能的安全漏洞
技能安全警告
技能本質上是 Markdown 指令檔案,可能包含提示注入、工具投毒、隱藏惡意指令。必須做的事:
- 安裝前檢查 ClawHub 上的 VirusTotal 報告
- 審核原始碼和來源
- 不要安裝太多活躍技能(每個請求都會載入更多上下文,增加回應時間)
- 使用 Cisco Skill Scanner 掃描社群插件
進階訓練技巧
1. 成本控制的模型分層
{
"models": {
"default": "cheap-model",
"fallbacks": {
"thinking": "claude-opus",
"coding": "gemini-pro"
}
}
}
便宜的預設模型處理例行工作,昂貴的模型只在需要深度推理時才啟用。
2. 上下文 TTL 管理
沒有 TTL 設定,你會更快撞到 token 上限,而且為重複處理相同上下文付費。設定適當的 softThresholdTokens,讓代理在上下文膨脹前主動精煉。
3. Heartbeat 主動任務
# HEARTBEAT.md
## 每次檢查
- 查看是否有未回覆的重要訊息
- 檢查 Shopify 訂單狀態異常
- 檢查 cron 任務是否正常執行
## 每日早上 9:00
- 編譯昨日客戶互動摘要
- 檢查今天的日程安排並提醒
## 每週一
- 產生上週專案進度報告
如果 HEARTBEAT.md 實際上是空的(只有空行和標題),OpenClaw 會跳過 heartbeat 執行以節省 API 費用。
4. 反饋迴路
最強大的訓練方式是建立反饋迴路。以 Reddit 摘要機器人為例:提示代理保留一個獨立的記憶檔案追蹤你的偏好,每天詢問清單是否命中目標。
5. 用 Git 管理 Workspace
cd ~/.openclaw/workspace
git init
git add AGENTS.md SOUL.md USER.md IDENTITY.md TOOLS.md HEARTBEAT.md
git commit -m "Initial workspace setup"
人格檔案和技能用 Git 管理非常適合。但 不要 把密鑰和快速增長的記憶日誌放進 Git。推薦模式:Git 管人格和技能,加密備份管 state 目錄和記憶。
常見錯誤(社群踩過的坑)
| 錯誤 | 正確做法 |
|---|---|
| 把臨時任務清單放在 SOUL.md | SOUL.md 只放永久性的人格和價值觀 |
| 在 AGENTS.md 塞個人偏好 | 個人偏好屬於 USER.md |
| 把 MEMORY.md 當原始對話紀錄 | MEMORY.md 應該是精煉過的、維護過的記憶 |
| 啟用 boot hooks 但沒定義 BOOT.md | 先寫好明確的啟動儀式再啟用 |
| 安裝太多技能 | 定期用 clawhub list 審計,移除不用的 |
| 第一條訊息就問正事 | 先跑 Bootstrap 設定代理身份 |
| 讓代理存取所有帳號 | 用專用帳號和專用瀏覽器 profile |