Local Whisper技能使用说明
2026-03-29
新闻来源:网淘吧
围观:28
电脑广告
手机广告
本地Whisper
免费转录Telegram和WhatsApp的语音消息。无需API密钥,无需费用,在您的Mac上运行。
问题所在
语音转录API需要付费:

- OpenAI Whisper:每分钟0.006美元
- Groq:每分钟0.001美元
- AssemblyAI:每分钟0.01美元
如果您需要转录大量Telegram语音消息,费用会不断累积。
解决方案
此工具在您的Mac上本地运行Whisper,质量相同,零成本。
- ✅ 永久免费
- ✅ 私密(音频数据不会离开您的Mac)
- ✅ 快速(每条消息约1秒)
- ✅ 支持离线使用
⚠️ 重要提示
- 首次运行会下载约1.5GB的模型——请耐心等待,这仅需执行一次
- 首次转录速度较慢——模型需要载入内存(约10-30秒),之后即可瞬间完成
- 已在使用OpenAI API进行转录?请将您现有的
tools.media.audio配置替换为以下内容
快速开始
1. 安装依赖项
pip3 install -r requirements.txt
2. 启动守护进程
python3 scripts/daemon.py
首次运行将下载Whisper模型(约1.5GB)。请等待出现"就绪"提示。
3. 添加到OpenClaw配置
将此内容添加至您的~/.openclaw/openclaw.json文件中:
{
"tools": {
"media": {
"audio": {
"enabled": true,
"models": [
{
"type": "cli",
"command": "~/.openclaw/workspace/skills/local-whisper/scripts/transcribe.sh",
"args": ["{{MediaPath}}"],
"timeoutSeconds": 60
}
]
}
}
}
}
4. 重启网关
openclaw gateway restart
现在来自Telegram、WhatsApp等平台的语音消息即可免费进行本地转录!
手动测试
./scripts/transcribe.sh voice_message.ogg
应用场景:Telegram语音消息
无需支付OpenAI API费用来转录传入的语音消息,将OpenClaw指向此本地守护进程。永久免费转录。
登录时自动启动
cp com.local-whisper.plist ~/Library/LaunchAgents/
launchctl load ~/Library/LaunchAgents/com.local-whisper.plist
API
守护进程运行于localhost:8787:
curl -X POST http://localhost:8787/transcribe -F "file=@audio.ogg"
# {"text": "Hello world", "language": "en"}
翻译
任意语言 → 英语:
./scripts/transcribe.sh spanish_audio.ogg --translate
要求
- 搭载Apple Silicon(M1/M2/M3/M4)的macOS
- Python 3.9+
许可证
MIT
文章底部电脑广告
手机广告位-内容正文底部
上一篇:Seisoai技能使用说明
下一篇:Tax Professional技能使用说明


微信扫一扫,打赏作者吧~