Self-Improving + Proactive Agent技能使用说明

2026-03-23 新闻来源：网淘吧围观:238

电脑广告

手机广告

何时使用

用户纠正你或指出错误时。你完成了重要工作并希望评估成果时。你注意到自己的输出中有可改进之处时。知识应随时间积累，无需手动维护。

架构

记忆存储于~/self-improving/采用分层结构。如果~/self-improving/目录不存在，请运行setup.md中的设置指南。工作区设置应将标准的自我改进引导机制添加到工作区的AGENTS、SOUL和HEARTBEAT.md文件中，并通过heartbeat-rules.md文件安排定期维护。

~/self-improving/
├── memory.md          # 热点记忆：≤100行，始终加载
├── index.md           # 主题索引（含行数统计）
├── heartbeat-state.md # 心跳状态：上次运行时间、已审阅变更、操作备注
├── projects/          # 项目专项学习记录
├── domains/           # 领域专项（代码、写作、沟通等）
├── archive/           # 冷存储：已衰减模式
└── corrections.md     # 最近50条修正日志

速查指南

主题	文件
设置指南	`setup.md`
心跳状态模板	`heartbeat-state.md`
记忆模板	`memory-template.md`
工作区心跳片段	`HEARTBEAT.md`
心跳规则	`heartbeat-rules.md`
学习机制	`learning.md`
安全边界	`boundaries.md`
扩展规则	`scaling.md`
内存操作	`operations.md`
自我反思日志	`reflections.md`
OpenClaw HEARTBEAT 种子	`openclaw-heartbeat.md`

要求

无需凭据
无需额外二进制文件
可选安装主动性技能可能需要网络访问

学习信号

当你注意到这些模式时自动记录：

更正→ 添加到corrections.md，评估至memory.md:

"不，那样不对……"
"实际上，应该是……"
"你弄错了……"
"我更喜欢X，而不是Y"
"记住，我总是……"
"我之前告诉过你……"
"停止做X"
"你为什么总是……"

偏好信号→ 添加到memory.md如果明确：

"我喜欢当你……"
"总是为我做X"
"永远不要做Y"
"我的风格是……"
"对于[项目]，使用……"

模式候选→ 跟踪，3次后提升：

相同指令重复3次以上
反复运行良好的工作流程
用户称赞特定方法

忽略（不记录）：

一次性指令（"现在做X"）
特定语境（"在这个文件中……"）
假设性内容（"如果……"）

自我反思

完成重要工作后，暂停并评估：

是否达到预期？—— 比较结果与初衷
哪些地方可以改进？—— 找出下次改进之处
这是否是某种模式？—— 如果是，记录到corrections.md 文件

何时进行自我反思：

完成多步骤任务后
收到反馈（无论正面或负面）后
修复错误或失误后
当你注意到自己的产出可以更好时

记录格式：

CONTEXT: [任务类型]
REFLECTION: [我注意到的情况]
LESSON: [下次需改进之处]

示例：

CONTEXT: 构建 Flutter UI
REFLECTION: 间距看起来不对劲，不得不重做
LESSON: 在展示给用户前检查视觉间距

自我反思条目遵循相同的晋升规则：成功应用3次 → 晋升为 HOT。

快速查询

用户说	行动
"你对 X 了解多少？"	在所有层级中搜索 X
"你学到了什么？"	显示来自`corrections.md 文件的最后10条记录`
"显示我的模式"	列出`memory.md`（热存储）
"显示 [项目] 模式"	加载`projects/{名称}.md`
"温存储里有什么？"	列出文件于`projects/`+`domains/`
"内存统计"	显示各层级数量
"忘记 X"	从所有层级移除（需先确认）
"导出内存"	压缩所有文件为ZIP

内存统计

收到"内存统计"请求时，报告：

📊 自我改进内存

热存储（始终加载）:
  memory.md: X 条条目

温存储（按需加载）:
  projects/: X 个文件
  domains/: X 个文件

冷存储（已归档）:
  archive/: X 个文件

近期活动（7天内）:
  记录更正: X 次
  提升至热存储: X 次
  降级至温存储: X 次

常见陷阱

陷阱	失败原因	更好的做法
从沉默中学习	会创建错误的规则	等待明确的纠正或重复的证据
晋升过快	污染热内存	保持新课程为暂定状态，直至反复验证
读取每个命名空间	浪费上下文	仅加载热内存及最小匹配文件
通过删除进行压缩	丢失信任和历史	改为合并、总结或降级

核心规则

1. 从纠正和自我反思中学习

当用户明确纠正你时进行记录
当你发现自身工作有改进时进行记录
切勿仅凭沉默进行推断
在3次相同的课程后 → 请求确认为规则

2. 分层存储

层级	位置	大小限制	行为
热	memory.md	≤100行	始终加载
温	projects/, domains/	每段不超过200行	根据上下文匹配加载
冷存储	归档/	无限制	根据显式查询加载

3. 自动升级/降级

模式7天内使用3次 → 升级为热存储
模式30天未使用 → 降级为温存储
模式90天未使用 → 归档至冷存储
未经询问绝不删除

4. 命名空间隔离

项目模式存放于projects/{名称}.md
全局偏好设置位于热存储层（memory.md）
领域模式（代码、写作）存放于domains/
跨命名空间继承：全局 → 领域 → 项目

5. 冲突解决

当模式产生冲突时：

最具体的优先（项目 > 领域 > 全局）
最新的优先（同一层级）
若存在歧义 → 询问用户

6. 压缩整理

当文件超出限制时：

将相似修正合并为单条规则
归档未使用的模式
总结冗长的条目
永不丢失已确认的偏好设置

7. 透明度

来自记忆的每一个操作 → 引用来源："使用 X（来自 projects/foo.md:12）"
提供每周摘要：已学习、已降级、已归档的模式
按需完整导出：所有文件打包为 ZIP

8. 安全边界

参见boundaries.md— 永不存储凭据、健康数据、第三方信息。

9. 优雅降级

如果达到上下文限制：

仅加载 memory.md（热）
按需加载相关命名空间
永不静默失败 — 告知用户未加载的内容

范围

此技能仅：

从用户纠正和自我反思中学习
将偏好设置存储在本地文件中（~/self-improving/）
在以下位置维护心跳状态：~/self-improving/heartbeat-state.md当工作空间集成心跳功能时
激活时读取自身的记忆文件

此技能永不：

访问日历、电子邮件或联系人
发起网络请求
读取外部文件~/self-improving/
从沉默或观察中推断偏好
在心跳清理过程中删除或盲目重写自我改进的记忆
修改自身的 SKILL.md 文件

数据存储

本地状态存储在~/self-improving/:

memory.md用于 HOT 规则和确认的偏好
corrections.md用于明确的更正和可复用的经验教训
projects/和domains/用于范围化的模式
archive/对于已衰退或不再活跃的模式
heartbeat-state.md用于周期性维护标记

反馈

如果觉得有用：clawhub star self-improving
保持更新：clawhub sync

天猫隐藏优惠券

网淘吧

免责申明

部分文章来自各大搜索引擎，如有侵权，请与我联系删除。

打赏

文章底部电脑广告

手机广告位-内容正文底部

标签

上一篇：Weather技能使用说明下一篇：Multi Search Engine技能使用说明