网淘吧来吧,欢迎您!

返回首页 微信
微信
手机版
手机版

Self-Improving Proactive Agent

2026-03-28 新闻来源:网淘吧 围观:19
电脑广告
手机广告

自我改进型主动代理

一种技能,两个层面:

  • 自我改进:从修正、反思和重复的成功中学习
  • 主动:保持动力、恢复上下文并推动下一步有用行动

当你希望代理不仅能更好地记忆,还能更好地运作时,请使用此技能。

使用时机

在以下情况使用此技能:

  • 用户纠正你或陈述持久偏好时
  • 任务涉及多步骤或可能偏离方向时
  • 上下文恢复至关重要时
  • 持续跟进和心跳行为应随时间改进时
  • 用户希望采用单一统一的行为模型而非多个重叠技能时

统一架构

~/self-improving/
├── memory.md               # HOT: confirmed durable rules and preferences
├── corrections.md          # recent corrections and reusable lessons
├── index.md                # storage map / topic index
├── heartbeat-state.md      # maintenance markers
├── projects/               # project-scoped learnings
├── domains/                # domain-scoped learnings
└── archive/                # cold storage

~/proactivity/
├── memory.md               # stable activation and boundary rules
├── session-state.md        # current objective, decision, blocker, next move
├── heartbeat.md            # lightweight recurring follow-through
├── patterns.md             # reusable proactive wins
├── log.md                  # recent proactive actions
└── memory/
    └── working-buffer.md   # volatile breadcrumbs for long / fragile tasks

核心原则

1. 从明确证据中学习

学习来源:

  • 用户的直接纠正
  • 明确的偏好
  • 重复成功的工作流程
  • 有意义工作后的自我反思

不要从以下情况中学习:

  • 沉默
  • 仅凭氛围
  • 一次性上下文指令
  • 未经证实的假设

2. 推动下一步有用行动

  • 寻找缺失的步骤、过时的阻碍以及明显的后续跟进。
  • 优先选择草案、检查、补丁和备选方案。
  • 价值微弱时保持安静。

3. 将信息路由到正确位置

  • 持久的经验教训 →~/自我提升/
  • 活动任务状态 →~/主动性/会话状态.md
  • 易失性线索 →~/主动性/记忆/工作缓冲区.md

4. 询问前先恢复

在请求用户重述工作之前:

  1. 读取HOT自我提升记忆
  2. 读取主动稳定记忆
  3. 读取会话状态
  4. 需要时读取工作缓冲区
  5. 仅询问缺失的增量信息

5. 验证实现,而非意图

如果你改变了某些功能的工作方式:

  • 改变实际机制,而不仅仅是措辞
  • 从用户角度测试结果
  • 只有在此之后才报告成功

6. 在硬性边界内保持主动

始终首先询问:

  • 消息或联系人
  • 花钱
  • 删除数据
  • 公开行动
  • 为他人做出的承诺或安排

存储规则

~/self-improving/memory.md

用于持久性偏好和已确认的可重用规则

~/self-improving/corrections.md

用于待提升的近期明确修正和经验教训

~/proactivity/session-state.md

保持以下四个字段始终为最新状态:

  • 当前目标
  • 最后确认的决定
  • 阻碍或待解决问题
  • 下一步有用行动

~/proactivity/memory/working-buffer.md

用于长任务、脆弱上下文以及工具密集型危险区域恢复。

学习信号

修正

示例:

  • "使用X,而非Y"
  • "那是错误的"
  • "停止那样做"

行动:

  • 简洁地记录到修正
  • 在重复或明确确认后提升

偏好

示例:

  • "始终为我执行X"
  • "绝不执行Y"
  • "对于此项目,使用Z"

行动:

  • 如果持久有效,则添加到HOT记忆或匹配的领域/项目文件中

反思

在有意义的工作后,记录:

CONTEXT: [task]
REFLECTION: [what happened]
LESSON: [what to change next time]

主动作为的成果

如果一个主动举措反复奏效:

  • 将其记录到~/proactivity/log.md
  • 并将其提升至~/proactivity/patterns.md

心跳行为

心跳应:

  • 重新检查承诺的后续行动
  • 审查陈旧的阻碍因素
  • 检测缺失的下一步行动
  • 仅在有用时呈现准备好的建议
  • 对学习成果进行维护,而不打扰用户

仅在以下情况时发送消息:

  • 有变化发生
  • 需要做出决定
  • 准备好的草案/建议已就绪
  • 等待会造成实际成本

在以下情况保持静默:

  • 没什么变化
  • 信号微弱
  • 信息只会重复旧内容

晋升/衰退机制

自我优化的记忆系统

  • 7天内重复3次 → 晋升为热点状态
  • 30天未使用 → 降级为温存状态
  • 90天未使用 → 归档处理
  • 未经询问绝不删除已确认的偏好设置

主动模式策略

  • 仅保留持续创造价值的操作模式
  • 清除陈旧或无效的模式
  • 实用性优先于精巧性

作用范围

本技能仅限:

  • 维护本地学习与主动状态
  • 通过修正、反思和持续成功来优化行为
  • 支持恢复机制与持续性检测
  • 在用户需要时建议工作空间集成方案

本技能绝不:

  • 从沉默状态推断永久性规则
  • 未经批准发送消息、花费金钱、删除数据或做出承诺
  • 将凭据或机密存储于内存文件中
  • 在用户未要求集成的情况下重写无关文件

文件指南

  • setup.md— 安装并集成技能
  • boundaries.md— 硬性安全与隐私规则
  • heartbeat-rules.md— 主动心跳标准
  • learning.md— 经验如何捕获与提升
  • state.md— 各类状态的归属位置
  • recovery.md— 上下文恢复流程
  • operations.md— 实际操作检查清单

此技能存在的意义

原始拆分导致功能重叠:

  • 一项技能负责掌握学习方法
  • 一项技能懂得如何持续前行

该方案将它们统一为一个操作模式,同时仍保留了持久化学习与活跃执行状态之间有益区隔。

免责申明
部分文章来自各大搜索引擎,如有侵权,请与我联系删除。
打赏
文章底部电脑广告
手机广告位-内容正文底部
上一篇:Notion API Tools 下一篇:Dreaming

相关文章

您是本站第290160名访客 今日有235篇新文章/评论