Elevenlabs Integration with Openclaw
2026-03-30
新闻来源:网淘吧
围观:11
电脑广告
手机广告
ClawVox
利用ClawVox——由ElevenLabs驱动,将您的OpenClaw助手转变为专业的语音制作工作室。
快速参考
| 操作 | 命令 | 描述 |
|---|---|---|
| 语音合成 | {baseDir}/scripts/speak.sh '文本' | 将文本转换为语音 |
| 语音转写 | {baseDir}/scripts/transcribe.sh audio.mp3 | 将语音转换为文本 |
| 克隆 | {baseDir}/scripts/clone.sh --name "语音名称" sample.mp3 | 克隆一个语音 |
| 音效 | {baseDir}/scripts/sfx.sh "雷暴" | 生成音效 |
| 语音列表 | {baseDir}/scripts/voices.sh list | 列出可用语音 |
| 配音 | {baseDir}/scripts/dub.sh --target es audio.mp3 | 翻译音频 |
| 隔离 | {baseDir}/scripts/isolate.sh audio.mp3 | 移除背景噪音 |
设置
- 从以下网址获取您的API密钥elevenlabs.io/app/settings/api-keys
- 在以下文件中配置
~/.openclaw/openclaw.json:
{
skills: {
entries: {
"clawvox": {
apiKey: "YOUR_ELEVENLABS_API_KEY",
config: {
defaultVoice: "Rachel",
defaultModel: "eleven_turbo_v2_5",
outputDir: "~/.openclaw/audio"
}
}
}
}
}
或者设置环境变量:

export ELEVENLABS_API_KEY="your_api_key_here"
语音生成(TTS)
基础文本转语音
# Quick speak with default voice (Rachel)
{baseDir}/scripts/speak.sh 'Hello, I am your personal AI assistant.'
# Specify voice by name
{baseDir}/scripts/speak.sh --voice Adam 'Hello from Adam'
# Save to file
{baseDir}/scripts/speak.sh --out ~/audio/greeting.mp3 'Welcome to the show'
# Use specific model
{baseDir}/scripts/speak.sh --model eleven_multilingual_v2 'Bonjour'
# Adjust voice settings
{baseDir}/scripts/speak.sh --stability 0.5 --similarity 0.8 'Expressive speech'
# Adjust speed
{baseDir}/scripts/speak.sh --speed 1.2 'Faster speech'
# Use multilingual model for other languages
{baseDir}/scripts/speak.sh --model eleven_multilingual_v2 --voice Rachel 'Hola, que tal'
{baseDir}/scripts/speak.sh --model eleven_multilingual_v2 --voice Adam 'Guten Tag'
语音模型
| 模型 | 延迟 | 语言 | 最佳适用场景 |
|---|---|---|---|
eleven_flash_v2_5 | 约75毫秒 | 32 | 实时、流式传输 |
eleven_turbo_v2_5 | 约250毫秒 | 32 | 平衡质量与速度 |
eleven_multilingual_v2 | 约500毫秒 | 29 | 长篇内容,最高质量 |
可用语音
预制语音:Rachel, Adam, Antoni, Bella, Domi, Elli, Josh, Sam, Callum, Charlie, George, Liam, Matilda, Alice, Bill, Brian, Chris, Daniel, Eric, Jessica, Laura, Lily, River, Roger, Sarah, Will
长篇内容
# Generate audio from text file
{baseDir}/scripts/speak.sh --input chapter.txt --voice "George" --out audiobook.mp3
语音转文本(转录)
基础转录
# Transcribe audio file
{baseDir}/scripts/transcribe.sh recording.mp3
# Save to file
{baseDir}/scripts/transcribe.sh --out transcript.txt audio.mp3
# Transcribe with language hint
{baseDir}/scripts/transcribe.sh --language es spanish_audio.mp3
# Include timestamps
{baseDir}/scripts/transcribe.sh --timestamps podcast.mp3
支持格式
- MP3, MP4, MPEG, MPGA, M4A, WAV, WebM
- 最大文件大小:100MB
语音克隆
即时语音克隆
# Clone from single sample (minimum 30 seconds recommended)
{baseDir}/scripts/clone.sh --name MyVoice recording.mp3
# Clone with description
{baseDir}/scripts/clone.sh --name BusinessVoice \
--description 'Professional male voice' \
sample.mp3
# Clone with labels
{baseDir}/scripts/clone.sh --name MyVoice \
--labels '{"gender":"male","age":"adult"}' \
sample.mp3
# Remove background noise during cloning
{baseDir}/scripts/clone.sh --name CleanVoice \
--remove-bg-noise \
sample.mp3
# Test cloned voice
{baseDir}/scripts/speak.sh --voice MyVoice 'Testing my cloned voice'
语音库管理
# List all available voices
{baseDir}/scripts/voices.sh list
# Get voice details
{baseDir}/scripts/voices.sh info --name Rachel
{baseDir}/scripts/voices.sh info --id 21m00Tcm4TlvDq8ikWAM
# Search voices (filter output with grep)
{baseDir}/scripts/voices.sh list | grep -i "female"
# Filter by category
{baseDir}/scripts/voices.sh list --category premade
{baseDir}/scripts/voices.sh list --category cloned
# Download voice preview
{baseDir}/scripts/voices.sh preview --name Rachel -o preview.mp3
# Delete custom voice
{baseDir}/scripts/voices.sh delete --id "voice_id"
音效
# Generate sound effect
{baseDir}/scripts/sfx.sh 'Heavy rain on a tin roof'
# With duration
{baseDir}/scripts/sfx.sh --duration 5 'Forest ambiance with birds'
# With prompt influence (higher = more accurate)
{baseDir}/scripts/sfx.sh --influence 0.8 'Sci-fi laser gun firing'
# Save to file
{baseDir}/scripts/sfx.sh --out effects/thunder.mp3 'Rolling thunder'
注意:时长范围为0.5至22秒(四舍五入至最近的0.5秒)
语音隔离
# Remove background noise and isolate voice
{baseDir}/scripts/isolate.sh noisy_recording.mp3
# Save to specific file
{baseDir}/scripts/isolate.sh --out clean_voice.mp3 meeting_recording.mp3
# Don't tag audio events
{baseDir}/scripts/isolate.sh --no-audio-events recording.mp3
要求:
- 最短时长:4.6秒
- 支持格式:MP3, WAV, M4A, OGG, FLAC
配音(多语言翻译)
# Dub audio to Spanish
{baseDir}/scripts/dub.sh --target es audio.mp3
# Dub with source language specified
{baseDir}/scripts/dub.sh --source en --target ja video.mp4
# Check dubbing status
{baseDir}/scripts/dub.sh --status --id "dubbing_id"
# Download dubbed audio
{baseDir}/scripts/dub.sh --download --id "dubbing_id" --out dubbed.mp3
支持语言:英语, 西班牙语, 法语, 德语, 意大利语, 葡萄牙语, 波兰语, 印地语, 阿拉伯语, 中文, 日语, 韩语, 荷兰语, 俄语, 土耳其语, 越南语, 瑞典语, 丹麦语, 芬兰语, 捷克语, 希腊语, 希伯来语, 印度尼西亚语, 马来语, 挪威语, 罗马尼亚语, 乌克兰语, 匈牙利语, 泰语
API使用示例
对于直接API访问,所有脚本底层都使用curl:
# Direct TTS API call
curl -X POST "https://api.elevenlabs.io/v1/text-to-speech/VOICE_ID" \
-H "xi-api-key: $ELEVENLABS_API_KEY" \
-H "Content-Type: application/json" \
-d '{"text": "Hello world", "model_id": "eleven_turbo_v2_5"}' \
--output speech.mp3
错误处理
所有脚本都提供有用的错误信息:
- 401:认证失败 - 请检查您的API密钥
- 403:权限被拒绝 - 您的API密钥可能没有访问权限
- 429:超出速率限制 - 请稍后再试
- 500/502/503:ElevenLabs API问题 - 请稍后重试
测试
运行测试套件以验证一切正常:
{baseDir}/test.sh YOUR_API_KEY
或使用环境变量:
export ELEVENLABS_API_KEY="your_key"
{baseDir}/test.sh
故障排除
常见问题
-
"执行主机不被允许(请求的网关)"
- 该技能需要在沙盒环境中运行命令
- 配置 OpenClaw 以使用沙盒:
tools.exec.host: "sandbox" - 或在您的 OpenClaw 配置中启用沙盒功能
- 替代方案:为网关主机配置执行批准(参见 OpenClaw 文档)
-
引号或感叹号导致的解析错误
- 使用单引号代替双引号:
'Hello world'而不是"Hello world!" - 使用双引号时避免在文本中使用感叹号(
!) - 对于复杂文本,请使用带有文件的
--input选项
- 使用单引号代替双引号:
-
"未设置 ELEVENLABS_API_KEY"
- 确保
ELEVENLABS_API_KEY已设置或在 openclaw.json 中配置 - 检查API密钥是否至少20个字符长
- 确保
-
"需要jq但未安装"
- 安装jq:
apt-get install jq(Linux)或brew install jq(macOS)
- 安装jq:
-
"超出速率限制"
- 请在elevenlabs.io/app/usage查看您的ElevenLabs计划配额
- 免费套餐:约每月10,000字符
-
"未找到语音"
- 使用
{baseDir}/scripts/voices.sh list查看可用语音 - 检查语音ID是否正确
- 使用
-
"配音失败"
- 确保源音频清晰可闻
- 检查支持的语言代码
-
"文件过大"
- 转录:最大100MB
- 配音:最大500MB
- 语音克隆:每个文件最大50MB
调试模式
# Enable verbose output
DEBUG=1 {baseDir}/scripts/speak.sh 'test'
# Show API request details
DEBUG=1 {baseDir}/scripts/transcribe.sh audio.mp3
定价说明
ElevenLabs API 定价(近似值):
- Flash v2.5:约 0.06 美元/分钟
- Turbo v2.5:约 0.06 美元/分钟
- 多语言 v2:约 0.12 美元/分钟
- 语音克隆:包含在套餐内
- 音效:约 0.02 美元/次生成
- 转录:约 0.02 美元/分钟(Scribe v1)
免费套餐:约 10,000 字符/月
链接
文章底部电脑广告
手机广告位-内容正文底部


微信扫一扫,打赏作者吧~