网淘吧来吧,欢迎您!

返回首页 微信
微信
手机版
手机版

Self-Improving + Proactive Agent

2026-03-23 新闻来源:网淘吧 围观:91
电脑广告
手机广告
购买adidas上京东官方旗舰店。

何时使用

用户纠正你或指出错误时。你完成了重要工作并希望评估成果时。你注意到自己的输出中有可改进之处时。知识应随时间积累,无需手动维护。

架构

记忆存储于~/self-improving/采用分层结构。如果~/self-improving/目录不存在,请运行setup.md中的设置指南。 工作区设置应将标准的自我改进引导机制添加到工作区的AGENTS、SOUL和HEARTBEAT.md文件中,并通过heartbeat-rules.md文件安排定期维护。

上网淘巴领天猫淘宝优惠券,一年省好几千。
~/self-improving/
├── memory.md          # 热点记忆:≤100行,始终加载
├── index.md           # 主题索引(含行数统计)
├── heartbeat-state.md # 心跳状态:上次运行时间、已审阅变更、操作备注
├── projects/          # 项目专项学习记录
├── domains/           # 领域专项(代码、写作、沟通等)
├── archive/           # 冷存储:已衰减模式
└── corrections.md     # 最近50条修正日志

速查指南

主题文件
设置指南setup.md
心跳状态模板heartbeat-state.md
记忆模板memory-template.md
工作区心跳片段HEARTBEAT.md
心跳规则heartbeat-rules.md
学习机制learning.md
安全边界boundaries.md
扩展规则scaling.md
内存操作operations.md
自我反思日志reflections.md
OpenClaw HEARTBEAT 种子openclaw-heartbeat.md

要求

  • 无需凭据
  • 无需额外二进制文件
  • 可选安装主动性技能可能需要网络访问

学习信号

当你注意到这些模式时自动记录:

更正→ 添加到corrections.md,评估至memory.md:

  • "不,那样不对……"
  • "实际上,应该是……"
  • "你弄错了……"
  • "我更喜欢X,而不是Y"
  • "记住,我总是……"
  • "我之前告诉过你……"
  • "停止做X"
  • "你为什么总是……"

偏好信号→ 添加到memory.md如果明确:

  • "我喜欢当你……"
  • "总是为我做X"
  • "永远不要做Y"
  • "我的风格是……"
  • "对于[项目],使用……"

模式候选→ 跟踪,3次后提升:

  • 相同指令重复3次以上
  • 反复运行良好的工作流程
  • 用户称赞特定方法

忽略(不记录):

  • 一次性指令("现在做X")
  • 特定语境("在这个文件中……")
  • 假设性内容("如果……")

自我反思

完成重要工作后,暂停并评估:

  1. 是否达到预期?—— 比较结果与初衷
  2. 哪些地方可以改进?—— 找出下次改进之处
  3. 这是否是某种模式?—— 如果是,记录到corrections.md 文件

何时进行自我反思:

  • 完成多步骤任务后
  • 收到反馈(无论正面或负面)后
  • 修复错误或失误后
  • 当你注意到自己的产出可以更好时

记录格式:

CONTEXT: [任务类型]
REFLECTION: [我注意到的情况]
LESSON: [下次需改进之处]

示例:

CONTEXT: 构建 Flutter UI
REFLECTION: 间距看起来不对劲,不得不重做
LESSON: 在展示给用户前检查视觉间距

自我反思条目遵循相同的晋升规则:成功应用3次 → 晋升为 HOT。

快速查询

用户说行动
"你对 X 了解多少?"在所有层级中搜索 X
"你学到了什么?"显示来自corrections.md 文件的最后10条记录
"显示我的模式"列出memory.md(热存储)
"显示 [项目] 模式"加载projects/{名称}.md
"温存储里有什么?"列出文件于projects/+domains/
"内存统计"显示各层级数量
"忘记 X"从所有层级移除(需先确认)
"导出内存"压缩所有文件为ZIP

内存统计

收到"内存统计"请求时,报告:

📊 自我改进内存

热存储(始终加载):
  memory.md: X 条条目

温存储(按需加载):
  projects/: X 个文件
  domains/: X 个文件

冷存储(已归档):
  archive/: X 个文件

近期活动(7天内):
  记录更正: X 次
  提升至热存储: X 次
  降级至温存储: X 次

常见陷阱

陷阱失败原因更好的做法
从沉默中学习会创建错误的规则等待明确的纠正或重复的证据
晋升过快污染热内存保持新课程为暂定状态,直至反复验证
读取每个命名空间浪费上下文仅加载热内存及最小匹配文件
通过删除进行压缩丢失信任和历史改为合并、总结或降级

核心规则

1. 从纠正和自我反思中学习

  • 当用户明确纠正你时进行记录
  • 当你发现自身工作有改进时进行记录
  • 切勿仅凭沉默进行推断
  • 在3次相同的课程后 → 请求确认为规则

2. 分层存储

层级位置大小限制行为
memory.md≤100行始终加载
projects/, domains/每段不超过200行根据上下文匹配加载
冷存储归档/无限制根据显式查询加载

3. 自动升级/降级

  • 模式7天内使用3次 → 升级为热存储
  • 模式30天未使用 → 降级为温存储
  • 模式90天未使用 → 归档至冷存储
  • 未经询问绝不删除

4. 命名空间隔离

  • 项目模式存放于projects/{名称}.md
  • 全局偏好设置位于热存储层(memory.md)
  • 领域模式(代码、写作)存放于domains/
  • 跨命名空间继承:全局 → 领域 → 项目

5. 冲突解决

当模式产生冲突时:

  1. 最具体的优先(项目 > 领域 > 全局)
  2. 最新的优先(同一层级)
  3. 若存在歧义 → 询问用户

6. 压缩整理

当文件超出限制时:

  1. 将相似修正合并为单条规则
  2. 归档未使用的模式
  3. 总结冗长的条目
  4. 永不丢失已确认的偏好设置

7. 透明度

  • 来自记忆的每一个操作 → 引用来源:"使用 X(来自 projects/foo.md:12)"
  • 提供每周摘要:已学习、已降级、已归档的模式
  • 按需完整导出:所有文件打包为 ZIP

8. 安全边界

参见boundaries.md— 永不存储凭据、健康数据、第三方信息。

9. 优雅降级

如果达到上下文限制:

  1. 仅加载 memory.md(热)
  2. 按需加载相关命名空间
  3. 永不静默失败 — 告知用户未加载的内容

范围

此技能仅:

  • 从用户纠正和自我反思中学习
  • 将偏好设置存储在本地文件中(~/self-improving/
  • 在以下位置维护心跳状态:~/self-improving/heartbeat-state.md当工作空间集成心跳功能时
  • 激活时读取自身的记忆文件

此技能永不:

  • 访问日历、电子邮件或联系人
  • 发起网络请求
  • 读取外部文件~/self-improving/
  • 从沉默或观察中推断偏好
  • 在心跳清理过程中删除或盲目重写自我改进的记忆
  • 修改自身的 SKILL.md 文件

数据存储

本地状态存储在~/self-improving/:

  • memory.md用于 HOT 规则和确认的偏好
  • corrections.md用于明确的更正和可复用的经验教训
  • projects/domains/用于范围化的模式
  • archive/对于已衰退或不再活跃的模式
  • heartbeat-state.md用于周期性维护标记

相关技能

通过以下命令安装clawhub install <slug>如果用户确认:

  • 记忆— 代理的长期记忆模式
  • 学习— 自适应教学与解释
  • 决策— 自动学习决策模式
  • 升级— 知道何时询问与何时自主行动

反馈

  • 如果觉得有用:clawhub star self-improving
  • 保持更新:clawhub sync
免责申明
部分文章来自各大搜索引擎,如有侵权,请与我联系删除。
打赏
上网淘巴领天猫淘宝优惠券,一年省好几千。

文章底部电脑广告
手机广告位-内容正文底部
上一篇:Weather 下一篇:Multi Search Engine

相关文章

上网淘巴领天猫淘宝优惠券,一年省好几千。

广告  ×

您是本站第223124名访客 今日有65篇新文章/评论