网淘吧来吧,欢迎您!

Local Whisper技能使用说明

2026-03-29 新闻来源:网淘吧 围观:28
电脑广告
手机广告

本地Whisper

免费转录Telegram和WhatsApp的语音消息。无需API密钥,无需费用,在您的Mac上运行。

问题所在

语音转录API需要付费:

Local Whisper

  • OpenAI Whisper:每分钟0.006美元
  • Groq:每分钟0.001美元
  • AssemblyAI:每分钟0.01美元

如果您需要转录大量Telegram语音消息,费用会不断累积。

解决方案

此工具在您的Mac上本地运行Whisper,质量相同,零成本

  • ✅ 永久免费
  • ✅ 私密(音频数据不会离开您的Mac)
  • ✅ 快速(每条消息约1秒)
  • ✅ 支持离线使用

⚠️ 重要提示

  • 首次运行会下载约1.5GB的模型——请耐心等待,这仅需执行一次
  • 首次转录速度较慢——模型需要载入内存(约10-30秒),之后即可瞬间完成
  • 已在使用OpenAI API进行转录?请将您现有的tools.media.audio配置替换为以下内容

快速开始

1. 安装依赖项

pip3 install -r requirements.txt

2. 启动守护进程

python3 scripts/daemon.py

首次运行将下载Whisper模型(约1.5GB)。请等待出现"就绪"提示。

3. 添加到OpenClaw配置

将此内容添加至您的~/.openclaw/openclaw.json文件中:

{
  "tools": {
    "media": {
      "audio": {
        "enabled": true,
        "models": [
          {
            "type": "cli",
            "command": "~/.openclaw/workspace/skills/local-whisper/scripts/transcribe.sh",
            "args": ["{{MediaPath}}"],
            "timeoutSeconds": 60
          }
        ]
      }
    }
  }
}

4. 重启网关

openclaw gateway restart

现在来自Telegram、WhatsApp等平台的语音消息即可免费进行本地转录!

手动测试

./scripts/transcribe.sh voice_message.ogg

应用场景:Telegram语音消息

无需支付OpenAI API费用来转录传入的语音消息,将OpenClaw指向此本地守护进程。永久免费转录。

登录时自动启动

cp com.local-whisper.plist ~/Library/LaunchAgents/
launchctl load ~/Library/LaunchAgents/com.local-whisper.plist

API

守护进程运行于localhost:8787

curl -X POST http://localhost:8787/transcribe -F "file=@audio.ogg"
# {"text": "Hello world", "language": "en"}

翻译

任意语言 → 英语:

./scripts/transcribe.sh spanish_audio.ogg --translate

要求

  • 搭载Apple Silicon(M1/M2/M3/M4)的macOS
  • Python 3.9+

许可证

MIT

免责申明
部分文章来自各大搜索引擎,如有侵权,请与我联系删除。
打赏
文章底部电脑广告
手机广告位-内容正文底部

相关文章

您是本站第326361名访客 今日有221篇新文章/评论