Model Router技能使用说明

2026-03-29 新闻来源：网淘吧围观:168

电脑广告

手机广告

模型路由器

跨多个供应商的智能AI模型路由，实现最优的性价比平衡。

根据任务的复杂性、类型和您的偏好，自动选择最佳模型。支持6大主流AI供应商，提供安全的API密钥管理和交互式配置。

🎯 功能概述

分析任务并按类型（编码、研究、创意、简单任务等）进行分类
将任务路由至最优模型从您配置的供应商中选择
优化成本简单任务使用更经济的模型
保障API密钥安全通过文件权限（600）和隔离存储
提供推荐附带置信度评分和推理过程

🚀 快速开始

步骤1：运行设置向导

cd skills/model-router
python3 scripts/setup-wizard.py

向导将引导您完成：

供应商设置- 添加您的API密钥（Anthropic、OpenAI、Gemini等）
任务映射- 为每种任务类型选择模型
偏好设置- 设置成本优化级别

步骤2：使用分类器

# Get model recommendation for a task
python3 scripts/classify_task.py "Build a React authentication system"

# Output:
# Recommended Model: claude-sonnet
# Confidence: 85%
# Cost Level: medium
# Reasoning: Matched 2 keywords: build, system

步骤3：通过会话路由任务

# Spawn with recommended model
sessions_spawn --task "Debug this memory leak" --model claude-sonnet

# Use aliases for quick access
sessions_spawn --task "What's the weather?" --model haiku

📊 支持的提供商

提供商	模型	最佳用途	密钥格式
Anthropic	claude-opus-4-5, claude-sonnet-4-5, claude-haiku-4-5	编码、推理、创意	`sk-ant-...`
OpenAI	gpt-4o, gpt-4o-mini, o1-mini, o1-preview	工具、深度推理	`sk-proj-...`
Gemini	gemini-2.0-flash, gemini-1.5-pro, gemini-1.5-flash	多模态、超大上下文（200万）	`AIza...`
Moonshot	moonshot-v1-8k/32k/128k	中文	`sk-...`
Z.ai	glm-4.5-air, glm-4.7	最便宜，快速	多种多样
GLM	glm-4-flash, glm-4-plus, glm-4-0520	中文，编程	`ID.secret`

🎛️ 任务类型映射

默认路由（可通过向导自定义）：

任务类型	默认模型	原因
`简单`	glm-4.5-air	针对快速查询最快、最便宜
`编程`	claude-sonnet-4-5	优秀的代码理解能力
`研究`	claude-sonnet-4-5	深度与速度的平衡
`创意`	claude-opus-4-5	最高创造力
`数学`	o1-mini	专业推理
`视觉`	gemini-1.5-flash	快速多模态
`中文`	glm-4.7	针对中文优化
`长上下文`	gemini-1.5-pro	高达200万tokens

💰 成本优化

激进模式

始终使用最便宜且能胜任的模型：

简单任务 → glm-4.5-air（约10%成本）
编程 → claude-haiku-4-5（约25%成本）
研究 → claude-sonnet-4-5（约50%成本）

节省：相比始终使用高级模型，可节省50-90%

均衡模式（默认）

考虑成本与质量：

简单任务 → 廉价模型
关键任务 → 高级模型
如果廉价模型失败则自动升级

质量模式

始终使用最佳模型，不计成本

🔒 安全性

API 密钥存储

~/.model-router/
├── config.json       # Model mappings (chmod 600)
└── .api-keys         # API keys (chmod 600)

功能：

文件权限限制为所有者 (600)
与版本控制隔离
静态加密（通过操作系统文件系统加密）
永不记录或打印

最佳实践

切勿提交 .api-keys至版本控制
使用环境变量用于生产部署
定期轮换密钥通过向导
审计访问使用ls -la ~/.model-router/

📖 使用示例

示例 1：成本优化工作流

# Classify task first
python3 scripts/classify_task.py "Extract prices from this CSV"

# Result: simple task → use glm-4.5-air
sessions_spawn --task "Extract prices" --model glm-4.5-air

# Then analyze with better model if needed
sessions_spawn --task "Analyze price trends" --model claude-sonnet

示例 2：渐进式升级

# Try cheap model first (60s timeout)
sessions_spawn --task "Fix this bug" --model glm-4.5-air --runTimeoutSeconds 60

# If fails, escalate to premium
sessions_spawn --task "Fix complex architecture bug" --model claude-opus

示例 3：并行处理

# Batch simple tasks in parallel with cheap model
sessions_spawn --task "Summarize doc A" --model glm-4.5-air &
sessions_spawn --task "Summarize doc B" --model glm-4.5-air &
sessions_spawn --task "Summarize doc C" --model glm-4.5-air &
wait

示例 4：使用 Gemini 的多模态

# Vision task with 2M token context
sessions_spawn --task "Analyze these 100 images" --model gemini-1.5-pro

🛠️ 配置文件

`~/.model-router/config.json`

{
  "version": "1.1.0",
  "providers": {
    "anthropic": {
      "configured": true,
      "models": ["claude-opus-4-5", "claude-sonnet-4-5", "claude-haiku-4-5"]
    },
    "openai": {
      "configured": true,
      "models": ["gpt-4o", "gpt-4o-mini", "o1-mini", "o1-preview"]
    }
  },
  "task_mappings": {
    "simple": "glm-4.5-air",
    "coding": "claude-sonnet-4-5",
    "research": "claude-sonnet-4-5",
    "creative": "claude-opus-4-5"
  },
  "preferences": {
    "cost_optimization": "balanced",
    "default_provider": "anthropic"
  }
}

`~/.model-router/.api-keys`

# Generated by setup wizard - DO NOT edit manually
ANTHROPIC_API_KEY=sk-ant-...
OPENAI_API_KEY=sk-proj-...
GEMINI_API_KEY=AIza...

🔄 版本 1.1 变更

新功能

✅交互式设置向导用于引导式配置
✅带文件权限的安全 API 密钥存储
✅任务到模型映射自定义
✅多供应商支持（6 个供应商）
✅成本优化级别（激进/平衡/质量）

改进

✅ 带置信度分数的更优任务分类
✅ 特定于供应商的模型推荐
✅ 通过隔离存储增强安全性
✅ 全面的文档

从 1.0 版本迁移

运行设置向导以重新配置：

python3 scripts/setup-wizard.py

📚 命令参考

设置向导

python3 scripts/setup-wizard.py

交互式配置供应商、映射和偏好设置。

任务分类器

python3 scripts/classify_task.py "your task description"
python3 scripts/classify_task.py "your task" --format json

获取附带推理的模型推荐。

列出模型

python3 scripts/setup-wizard.py --list

显示所有可用模型及其状态。

🤝 与其他技能的集成

技能	集成
模型使用情况	跟踪每个供应商的成本以优化路由
会话生成	模型委托的主要工具
会话状态	检查当前模型及使用情况

⚡ 性能优化建议

从简单开始- 首先尝试经济型模型
批量处理任务- 合并多个简单任务
及时清理- 一次性任务完成后删除会话
设置超时- 防止子代理失控运行
监控使用情况- 按供应商跟踪成本

🐛 故障排除

"未找到合适的模型"

运行设置向导以配置供应商
检查API密钥是否有效
验证.api-keys文件的权限

"模块未找到"

pip3 install -r requirements.txt  # if needed

选择了错误的模型

通过向导自定义任务映射
在sessions_spawn --model
中指定模型

调整成本优化偏好

📖 额外资源
- 供应商文档：
- Anthropic
- OpenAI
- Gemini
- Moonshot
- Z.ai
GLM设置：运行
python3 scripts/setup-wizard.py支持：查看references/

免责申明

部分文章来自各大搜索引擎，如有侵权，请与我联系删除。

打赏

文章底部电脑广告

手机广告位-内容正文底部

标签

上一篇：Parallel Deep Research技能使用说明下一篇：ClickSend技能使用说明