Model Router技能使用说明
2026-03-29
新闻来源:网淘吧
围观:21
电脑广告
手机广告
模型路由器
跨多个供应商的智能AI模型路由,实现最优的性价比平衡。
根据任务的复杂性、类型和您的偏好,自动选择最佳模型。支持6大主流AI供应商,提供安全的API密钥管理和交互式配置。
🎯 功能概述
- 分析任务并按类型(编码、研究、创意、简单任务等)进行分类
- 将任务路由至最优模型从您配置的供应商中选择
- 优化成本简单任务使用更经济的模型
- 保障API密钥安全通过文件权限(600)和隔离存储
- 提供推荐附带置信度评分和推理过程
🚀 快速开始
步骤1:运行设置向导
cd skills/model-router
python3 scripts/setup-wizard.py
向导将引导您完成:
- 供应商设置- 添加您的API密钥(Anthropic、OpenAI、Gemini等)
- 任务映射- 为每种任务类型选择模型
- 偏好设置- 设置成本优化级别
步骤2:使用分类器
# Get model recommendation for a task
python3 scripts/classify_task.py "Build a React authentication system"
# Output:
# Recommended Model: claude-sonnet
# Confidence: 85%
# Cost Level: medium
# Reasoning: Matched 2 keywords: build, system
步骤3:通过会话路由任务
# Spawn with recommended model
sessions_spawn --task "Debug this memory leak" --model claude-sonnet
# Use aliases for quick access
sessions_spawn --task "What's the weather?" --model haiku
📊 支持的提供商
| 提供商 | 模型 | 最佳用途 | 密钥格式 |
|---|---|---|---|
| Anthropic | claude-opus-4-5, claude-sonnet-4-5, claude-haiku-4-5 | 编码、推理、创意 | sk-ant-... |
| OpenAI | gpt-4o, gpt-4o-mini, o1-mini, o1-preview | 工具、深度推理 | sk-proj-... |
| Gemini | gemini-2.0-flash, gemini-1.5-pro, gemini-1.5-flash | 多模态、超大上下文(200万) | AIza... |
| Moonshot | moonshot-v1-8k/32k/128k | 中文 | sk-... |
| Z.ai | glm-4.5-air, glm-4.7 | 最便宜,快速 | 多种多样 |
| GLM | glm-4-flash, glm-4-plus, glm-4-0520 | 中文,编程 | ID.secret |
🎛️ 任务类型映射
默认路由(可通过向导自定义):
| 任务类型 | 默认模型 | 原因 |
|---|---|---|
简单 | glm-4.5-air | 针对快速查询最快、最便宜 |
编程 | claude-sonnet-4-5 | 优秀的代码理解能力 |
研究 | claude-sonnet-4-5 | 深度与速度的平衡 |
创意 | claude-opus-4-5 | 最高创造力 |
数学 | o1-mini | 专业推理 |
视觉 | gemini-1.5-flash | 快速多模态 |
中文 | glm-4.7 | 针对中文优化 |
长上下文 | gemini-1.5-pro | 高达200万tokens |
💰 成本优化
激进模式
始终使用最便宜且能胜任的模型:
- 简单任务 → glm-4.5-air(约10%成本)
- 编程 → claude-haiku-4-5(约25%成本)
- 研究 → claude-sonnet-4-5(约50%成本)
节省:相比始终使用高级模型,可节省50-90%
均衡模式(默认)
考虑成本与质量:
- 简单任务 → 廉价模型
- 关键任务 → 高级模型
- 如果廉价模型失败则自动升级
质量模式
始终使用最佳模型,不计成本
🔒 安全性
API 密钥存储
~/.model-router/
├── config.json # Model mappings (chmod 600)
└── .api-keys # API keys (chmod 600)
功能:
- 文件权限限制为所有者 (600)
- 与版本控制隔离
- 静态加密(通过操作系统文件系统加密)
- 永不记录或打印
最佳实践
- 切勿提交
.api-keys至版本控制 - 使用环境变量用于生产部署
- 定期轮换密钥通过向导
- 审计访问使用
ls -la ~/.model-router/
📖 使用示例
示例 1:成本优化工作流
# Classify task first
python3 scripts/classify_task.py "Extract prices from this CSV"
# Result: simple task → use glm-4.5-air
sessions_spawn --task "Extract prices" --model glm-4.5-air
# Then analyze with better model if needed
sessions_spawn --task "Analyze price trends" --model claude-sonnet
示例 2:渐进式升级
# Try cheap model first (60s timeout)
sessions_spawn --task "Fix this bug" --model glm-4.5-air --runTimeoutSeconds 60
# If fails, escalate to premium
sessions_spawn --task "Fix complex architecture bug" --model claude-opus
示例 3:并行处理
# Batch simple tasks in parallel with cheap model
sessions_spawn --task "Summarize doc A" --model glm-4.5-air &
sessions_spawn --task "Summarize doc B" --model glm-4.5-air &
sessions_spawn --task "Summarize doc C" --model glm-4.5-air &
wait
示例 4:使用 Gemini 的多模态
# Vision task with 2M token context
sessions_spawn --task "Analyze these 100 images" --model gemini-1.5-pro
🛠️ 配置文件
~/.model-router/config.json
{
"version": "1.1.0",
"providers": {
"anthropic": {
"configured": true,
"models": ["claude-opus-4-5", "claude-sonnet-4-5", "claude-haiku-4-5"]
},
"openai": {
"configured": true,
"models": ["gpt-4o", "gpt-4o-mini", "o1-mini", "o1-preview"]
}
},
"task_mappings": {
"simple": "glm-4.5-air",
"coding": "claude-sonnet-4-5",
"research": "claude-sonnet-4-5",
"creative": "claude-opus-4-5"
},
"preferences": {
"cost_optimization": "balanced",
"default_provider": "anthropic"
}
}
~/.model-router/.api-keys
# Generated by setup wizard - DO NOT edit manually
ANTHROPIC_API_KEY=sk-ant-...
OPENAI_API_KEY=sk-proj-...
GEMINI_API_KEY=AIza...
🔄 版本 1.1 变更
新功能
- ✅交互式设置向导用于引导式配置
- ✅带文件权限的安全 API 密钥存储
- ✅任务到模型映射自定义
- ✅多供应商支持(6 个供应商)
- ✅成本优化级别(激进/平衡/质量)
改进
- ✅ 带置信度分数的更优任务分类
- ✅ 特定于供应商的模型推荐
- ✅ 通过隔离存储增强安全性
- ✅ 全面的文档
从 1.0 版本迁移
运行设置向导以重新配置:
python3 scripts/setup-wizard.py
📚 命令参考
设置向导
python3 scripts/setup-wizard.py
交互式配置供应商、映射和偏好设置。
任务分类器
python3 scripts/classify_task.py "your task description"
python3 scripts/classify_task.py "your task" --format json
获取附带推理的模型推荐。
列出模型
python3 scripts/setup-wizard.py --list
显示所有可用模型及其状态。
🤝 与其他技能的集成
| 技能 | 集成 |
|---|---|
| 模型使用情况 | 跟踪每个供应商的成本以优化路由 |
| 会话生成 | 模型委托的主要工具 |
| 会话状态 | 检查当前模型及使用情况 |
⚡ 性能优化建议
- 从简单开始- 首先尝试经济型模型
- 批量处理任务- 合并多个简单任务
- 及时清理- 一次性任务完成后删除会话
- 设置超时- 防止子代理失控运行
- 监控使用情况- 按供应商跟踪成本
🐛 故障排除
"未找到合适的模型"
- 运行设置向导以配置供应商
- 检查API密钥是否有效
- 验证
.api-keys文件的权限
"模块未找到"
pip3 install -r requirements.txt # if needed
选择了错误的模型
- 通过向导自定义任务映射
- 在
sessions_spawn --model - 中指定模型
调整成本优化偏好
文章底部电脑广告
手机广告位-内容正文底部


微信扫一扫,打赏作者吧~