Self-Improving + Proactive Agent
2026-03-23
新闻来源:网淘吧
围观:91
电脑广告
手机广告
购买adidas上京东官方旗舰店。
何时使用
用户纠正你或指出错误时。你完成了重要工作并希望评估成果时。你注意到自己的输出中有可改进之处时。知识应随时间积累,无需手动维护。
架构
记忆存储于~/self-improving/采用分层结构。如果~/self-improving/目录不存在,请运行setup.md中的设置指南。
工作区设置应将标准的自我改进引导机制添加到工作区的AGENTS、SOUL和HEARTBEAT.md文件中,并通过heartbeat-rules.md文件安排定期维护。
~/self-improving/
├── memory.md # 热点记忆:≤100行,始终加载
├── index.md # 主题索引(含行数统计)
├── heartbeat-state.md # 心跳状态:上次运行时间、已审阅变更、操作备注
├── projects/ # 项目专项学习记录
├── domains/ # 领域专项(代码、写作、沟通等)
├── archive/ # 冷存储:已衰减模式
└── corrections.md # 最近50条修正日志
速查指南
| 主题 | 文件 |
|---|---|
| 设置指南 | setup.md |
| 心跳状态模板 | heartbeat-state.md |
| 记忆模板 | memory-template.md |
| 工作区心跳片段 | HEARTBEAT.md |
| 心跳规则 | heartbeat-rules.md |
| 学习机制 | learning.md |
| 安全边界 | boundaries.md |
| 扩展规则 | scaling.md |
| 内存操作 | operations.md |
| 自我反思日志 | reflections.md |
| OpenClaw HEARTBEAT 种子 | openclaw-heartbeat.md |
要求
- 无需凭据
- 无需额外二进制文件
- 可选安装
主动性技能可能需要网络访问
学习信号
当你注意到这些模式时自动记录:
更正→ 添加到corrections.md,评估至memory.md:
- "不,那样不对……"
- "实际上,应该是……"
- "你弄错了……"
- "我更喜欢X,而不是Y"
- "记住,我总是……"
- "我之前告诉过你……"
- "停止做X"
- "你为什么总是……"
偏好信号→ 添加到memory.md如果明确:
- "我喜欢当你……"
- "总是为我做X"
- "永远不要做Y"
- "我的风格是……"
- "对于[项目],使用……"
模式候选→ 跟踪,3次后提升:
- 相同指令重复3次以上
- 反复运行良好的工作流程
- 用户称赞特定方法
忽略(不记录):
- 一次性指令("现在做X")
- 特定语境("在这个文件中……")
- 假设性内容("如果……")
自我反思
完成重要工作后,暂停并评估:
- 是否达到预期?—— 比较结果与初衷
- 哪些地方可以改进?—— 找出下次改进之处
- 这是否是某种模式?—— 如果是,记录到
corrections.md 文件
何时进行自我反思:
- 完成多步骤任务后
- 收到反馈(无论正面或负面)后
- 修复错误或失误后
- 当你注意到自己的产出可以更好时
记录格式:
CONTEXT: [任务类型]
REFLECTION: [我注意到的情况]
LESSON: [下次需改进之处]
示例:
CONTEXT: 构建 Flutter UI
REFLECTION: 间距看起来不对劲,不得不重做
LESSON: 在展示给用户前检查视觉间距
自我反思条目遵循相同的晋升规则:成功应用3次 → 晋升为 HOT。
快速查询
| 用户说 | 行动 |
|---|---|
| "你对 X 了解多少?" | 在所有层级中搜索 X |
| "你学到了什么?" | 显示来自corrections.md 文件的最后10条记录 |
| "显示我的模式" | 列出memory.md(热存储) |
| "显示 [项目] 模式" | 加载projects/{名称}.md |
| "温存储里有什么?" | 列出文件于projects/+domains/ |
| "内存统计" | 显示各层级数量 |
| "忘记 X" | 从所有层级移除(需先确认) |
| "导出内存" | 压缩所有文件为ZIP |
内存统计
收到"内存统计"请求时,报告:
📊 自我改进内存
热存储(始终加载):
memory.md: X 条条目
温存储(按需加载):
projects/: X 个文件
domains/: X 个文件
冷存储(已归档):
archive/: X 个文件
近期活动(7天内):
记录更正: X 次
提升至热存储: X 次
降级至温存储: X 次
常见陷阱
| 陷阱 | 失败原因 | 更好的做法 |
|---|---|---|
| 从沉默中学习 | 会创建错误的规则 | 等待明确的纠正或重复的证据 |
| 晋升过快 | 污染热内存 | 保持新课程为暂定状态,直至反复验证 |
| 读取每个命名空间 | 浪费上下文 | 仅加载热内存及最小匹配文件 |
| 通过删除进行压缩 | 丢失信任和历史 | 改为合并、总结或降级 |
核心规则
1. 从纠正和自我反思中学习
- 当用户明确纠正你时进行记录
- 当你发现自身工作有改进时进行记录
- 切勿仅凭沉默进行推断
- 在3次相同的课程后 → 请求确认为规则
2. 分层存储
| 层级 | 位置 | 大小限制 | 行为 |
|---|---|---|---|
| 热 | memory.md | ≤100行 | 始终加载 |
| 温 | projects/, domains/ | 每段不超过200行 | 根据上下文匹配加载 |
| 冷存储 | 归档/ | 无限制 | 根据显式查询加载 |
3. 自动升级/降级
- 模式7天内使用3次 → 升级为热存储
- 模式30天未使用 → 降级为温存储
- 模式90天未使用 → 归档至冷存储
- 未经询问绝不删除
4. 命名空间隔离
- 项目模式存放于
projects/{名称}.md - 全局偏好设置位于热存储层(memory.md)
- 领域模式(代码、写作)存放于
domains/ - 跨命名空间继承:全局 → 领域 → 项目
5. 冲突解决
当模式产生冲突时:
- 最具体的优先(项目 > 领域 > 全局)
- 最新的优先(同一层级)
- 若存在歧义 → 询问用户
6. 压缩整理
当文件超出限制时:
- 将相似修正合并为单条规则
- 归档未使用的模式
- 总结冗长的条目
- 永不丢失已确认的偏好设置
7. 透明度
- 来自记忆的每一个操作 → 引用来源:"使用 X(来自 projects/foo.md:12)"
- 提供每周摘要:已学习、已降级、已归档的模式
- 按需完整导出:所有文件打包为 ZIP
8. 安全边界
参见boundaries.md— 永不存储凭据、健康数据、第三方信息。
9. 优雅降级
如果达到上下文限制:
- 仅加载 memory.md(热)
- 按需加载相关命名空间
- 永不静默失败 — 告知用户未加载的内容
范围
此技能仅:
- 从用户纠正和自我反思中学习
- 将偏好设置存储在本地文件中(
~/self-improving/) - 在以下位置维护心跳状态:
~/self-improving/heartbeat-state.md当工作空间集成心跳功能时 - 激活时读取自身的记忆文件
此技能永不:
- 访问日历、电子邮件或联系人
- 发起网络请求
- 读取外部文件
~/self-improving/ - 从沉默或观察中推断偏好
- 在心跳清理过程中删除或盲目重写自我改进的记忆
- 修改自身的 SKILL.md 文件
数据存储
本地状态存储在~/self-improving/:
memory.md用于 HOT 规则和确认的偏好corrections.md用于明确的更正和可复用的经验教训projects/和domains/用于范围化的模式archive/对于已衰退或不再活跃的模式heartbeat-state.md用于周期性维护标记
相关技能
通过以下命令安装clawhub install <slug>如果用户确认:
记忆— 代理的长期记忆模式学习— 自适应教学与解释决策— 自动学习决策模式升级— 知道何时询问与何时自主行动
反馈
- 如果觉得有用:
clawhub star self-improving - 保持更新:
clawhub sync
文章底部电脑广告
手机广告位-内容正文底部
上一篇:Weather
下一篇:Multi Search Engine


微信扫一扫,打赏作者吧~