网淘吧来吧,欢迎您!

Model Router技能使用说明

2026-03-29 新闻来源:网淘吧 围观:21
电脑广告
手机广告

模型路由器

跨多个供应商的智能AI模型路由,实现最优的性价比平衡。

根据任务的复杂性、类型和您的偏好,自动选择最佳模型。支持6大主流AI供应商,提供安全的API密钥管理和交互式配置。

🎯 功能概述

  • 分析任务并按类型(编码、研究、创意、简单任务等)进行分类
  • 将任务路由至最优模型从您配置的供应商中选择
  • 优化成本简单任务使用更经济的模型
  • 保障API密钥安全通过文件权限(600)和隔离存储
  • 提供推荐附带置信度评分和推理过程

🚀 快速开始

步骤1:运行设置向导

cd skills/model-router
python3 scripts/setup-wizard.py

向导将引导您完成:

  1. 供应商设置- 添加您的API密钥(Anthropic、OpenAI、Gemini等)
  2. 任务映射- 为每种任务类型选择模型
  3. 偏好设置- 设置成本优化级别

步骤2:使用分类器

# Get model recommendation for a task
python3 scripts/classify_task.py "Build a React authentication system"

# Output:
# Recommended Model: claude-sonnet
# Confidence: 85%
# Cost Level: medium
# Reasoning: Matched 2 keywords: build, system

步骤3:通过会话路由任务

# Spawn with recommended model
sessions_spawn --task "Debug this memory leak" --model claude-sonnet

# Use aliases for quick access
sessions_spawn --task "What's the weather?" --model haiku

📊 支持的提供商

提供商模型最佳用途密钥格式
Anthropicclaude-opus-4-5, claude-sonnet-4-5, claude-haiku-4-5编码、推理、创意sk-ant-...
OpenAIgpt-4o, gpt-4o-mini, o1-mini, o1-preview工具、深度推理sk-proj-...
Geminigemini-2.0-flash, gemini-1.5-pro, gemini-1.5-flash多模态、超大上下文(200万)AIza...
Moonshotmoonshot-v1-8k/32k/128k中文sk-...
Z.aiglm-4.5-air, glm-4.7最便宜,快速多种多样
GLMglm-4-flash, glm-4-plus, glm-4-0520中文,编程ID.secret

🎛️ 任务类型映射

默认路由(可通过向导自定义):

任务类型默认模型原因
简单glm-4.5-air针对快速查询最快、最便宜
编程claude-sonnet-4-5优秀的代码理解能力
研究claude-sonnet-4-5深度与速度的平衡
创意claude-opus-4-5最高创造力
数学o1-mini专业推理
视觉gemini-1.5-flash快速多模态
中文glm-4.7针对中文优化
长上下文gemini-1.5-pro高达200万tokens

💰 成本优化

激进模式

始终使用最便宜且能胜任的模型:

  • 简单任务 → glm-4.5-air(约10%成本)
  • 编程 → claude-haiku-4-5(约25%成本)
  • 研究 → claude-sonnet-4-5(约50%成本)

节省:相比始终使用高级模型,可节省50-90%

均衡模式(默认)

考虑成本与质量:

  • 简单任务 → 廉价模型
  • 关键任务 → 高级模型
  • 如果廉价模型失败则自动升级

质量模式

始终使用最佳模型,不计成本

🔒 安全性

API 密钥存储

~/.model-router/
├── config.json       # Model mappings (chmod 600)
└── .api-keys         # API keys (chmod 600)

功能:

  • 文件权限限制为所有者 (600)
  • 与版本控制隔离
  • 静态加密(通过操作系统文件系统加密)
  • 永不记录或打印

最佳实践

  1. 切勿提交 .api-keys至版本控制
  2. 使用环境变量用于生产部署
  3. 定期轮换密钥通过向导
  4. 审计访问使用ls -la ~/.model-router/

📖 使用示例

示例 1:成本优化工作流

# Classify task first
python3 scripts/classify_task.py "Extract prices from this CSV"

# Result: simple task → use glm-4.5-air
sessions_spawn --task "Extract prices" --model glm-4.5-air

# Then analyze with better model if needed
sessions_spawn --task "Analyze price trends" --model claude-sonnet

示例 2:渐进式升级

# Try cheap model first (60s timeout)
sessions_spawn --task "Fix this bug" --model glm-4.5-air --runTimeoutSeconds 60

# If fails, escalate to premium
sessions_spawn --task "Fix complex architecture bug" --model claude-opus

示例 3:并行处理

# Batch simple tasks in parallel with cheap model
sessions_spawn --task "Summarize doc A" --model glm-4.5-air &
sessions_spawn --task "Summarize doc B" --model glm-4.5-air &
sessions_spawn --task "Summarize doc C" --model glm-4.5-air &
wait

示例 4:使用 Gemini 的多模态

# Vision task with 2M token context
sessions_spawn --task "Analyze these 100 images" --model gemini-1.5-pro

🛠️ 配置文件

~/.model-router/config.json

{
  "version": "1.1.0",
  "providers": {
    "anthropic": {
      "configured": true,
      "models": ["claude-opus-4-5", "claude-sonnet-4-5", "claude-haiku-4-5"]
    },
    "openai": {
      "configured": true,
      "models": ["gpt-4o", "gpt-4o-mini", "o1-mini", "o1-preview"]
    }
  },
  "task_mappings": {
    "simple": "glm-4.5-air",
    "coding": "claude-sonnet-4-5",
    "research": "claude-sonnet-4-5",
    "creative": "claude-opus-4-5"
  },
  "preferences": {
    "cost_optimization": "balanced",
    "default_provider": "anthropic"
  }
}

~/.model-router/.api-keys

# Generated by setup wizard - DO NOT edit manually
ANTHROPIC_API_KEY=sk-ant-...
OPENAI_API_KEY=sk-proj-...
GEMINI_API_KEY=AIza...

🔄 版本 1.1 变更

新功能

  • 交互式设置向导用于引导式配置
  • 带文件权限的安全 API 密钥存储
  • 任务到模型映射自定义
  • 多供应商支持(6 个供应商)
  • 成本优化级别(激进/平衡/质量)

改进

  • ✅ 带置信度分数的更优任务分类
  • ✅ 特定于供应商的模型推荐
  • ✅ 通过隔离存储增强安全性
  • ✅ 全面的文档

从 1.0 版本迁移

运行设置向导以重新配置:

python3 scripts/setup-wizard.py

📚 命令参考

设置向导

python3 scripts/setup-wizard.py

交互式配置供应商、映射和偏好设置。

任务分类器

python3 scripts/classify_task.py "your task description"
python3 scripts/classify_task.py "your task" --format json

获取附带推理的模型推荐。

列出模型

python3 scripts/setup-wizard.py --list

显示所有可用模型及其状态。

🤝 与其他技能的集成

技能集成
模型使用情况跟踪每个供应商的成本以优化路由
会话生成模型委托的主要工具
会话状态检查当前模型及使用情况

⚡ 性能优化建议

  1. 从简单开始- 首先尝试经济型模型
  2. 批量处理任务- 合并多个简单任务
  3. 及时清理- 一次性任务完成后删除会话
  4. 设置超时- 防止子代理失控运行
  5. 监控使用情况- 按供应商跟踪成本

🐛 故障排除

"未找到合适的模型"

  • 运行设置向导以配置供应商
  • 检查API密钥是否有效
  • 验证.api-keys文件的权限

"模块未找到"

pip3 install -r requirements.txt  # if needed

选择了错误的模型

  1. 通过向导自定义任务映射
  2. sessions_spawn --model
  3. 中指定模型

调整成本优化偏好

免责申明
部分文章来自各大搜索引擎,如有侵权,请与我联系删除。
打赏
文章底部电脑广告
手机广告位-内容正文底部

相关文章

您是本站第326244名访客 今日有220篇新文章/评论