Elevenlabs Integration with Openclaw技能使用说明

2026-03-30 新闻来源：网淘吧围观:148

电脑广告

手机广告

ClawVox

利用ClawVox——由ElevenLabs驱动，将您的OpenClaw助手转变为专业的语音制作工作室。

快速参考

操作	命令	描述
语音合成	`{baseDir}/scripts/speak.sh '文本'`	将文本转换为语音
语音转写	`{baseDir}/scripts/transcribe.sh audio.mp3`	将语音转换为文本
克隆	`{baseDir}/scripts/clone.sh --name "语音名称" sample.mp3`	克隆一个语音
音效	`{baseDir}/scripts/sfx.sh "雷暴"`	生成音效
语音列表	`{baseDir}/scripts/voices.sh list`	列出可用语音
配音	`{baseDir}/scripts/dub.sh --target es audio.mp3`	翻译音频
隔离	`{baseDir}/scripts/isolate.sh audio.mp3`	移除背景噪音

设置

从以下网址获取您的API密钥elevenlabs.io/app/settings/api-keys
在以下文件中配置~/.openclaw/openclaw.json：

{
  skills: {
    entries: {
      "clawvox": {
        apiKey: "YOUR_ELEVENLABS_API_KEY",
        config: {
          defaultVoice: "Rachel",
          defaultModel: "eleven_turbo_v2_5",
          outputDir: "~/.openclaw/audio"
        }
      }
    }
  }
}

或者设置环境变量：

Elevenlabs Integration with Openclaw

export ELEVENLABS_API_KEY="your_api_key_here"

语音生成（TTS）

基础文本转语音

# Quick speak with default voice (Rachel)
{baseDir}/scripts/speak.sh 'Hello, I am your personal AI assistant.'

# Specify voice by name
{baseDir}/scripts/speak.sh --voice Adam 'Hello from Adam'

# Save to file
{baseDir}/scripts/speak.sh --out ~/audio/greeting.mp3 'Welcome to the show'

# Use specific model
{baseDir}/scripts/speak.sh --model eleven_multilingual_v2 'Bonjour'

# Adjust voice settings
{baseDir}/scripts/speak.sh --stability 0.5 --similarity 0.8 'Expressive speech'

# Adjust speed
{baseDir}/scripts/speak.sh --speed 1.2 'Faster speech'

# Use multilingual model for other languages
{baseDir}/scripts/speak.sh --model eleven_multilingual_v2 --voice Rachel 'Hola, que tal'
{baseDir}/scripts/speak.sh --model eleven_multilingual_v2 --voice Adam 'Guten Tag'

语音模型

模型	延迟	语言	最佳适用场景
`eleven_flash_v2_5`	约75毫秒	32	实时、流式传输
`eleven_turbo_v2_5`	约250毫秒	32	平衡质量与速度
`eleven_multilingual_v2`	约500毫秒	29	长篇内容，最高质量

可用语音

预制语音：Rachel, Adam, Antoni, Bella, Domi, Elli, Josh, Sam, Callum, Charlie, George, Liam, Matilda, Alice, Bill, Brian, Chris, Daniel, Eric, Jessica, Laura, Lily, River, Roger, Sarah, Will

长篇内容

# Generate audio from text file
{baseDir}/scripts/speak.sh --input chapter.txt --voice "George" --out audiobook.mp3

语音转文本（转录）

基础转录

# Transcribe audio file
{baseDir}/scripts/transcribe.sh recording.mp3

# Save to file
{baseDir}/scripts/transcribe.sh --out transcript.txt audio.mp3

# Transcribe with language hint
{baseDir}/scripts/transcribe.sh --language es spanish_audio.mp3

# Include timestamps
{baseDir}/scripts/transcribe.sh --timestamps podcast.mp3

支持格式

MP3, MP4, MPEG, MPGA, M4A, WAV, WebM
最大文件大小：100MB

语音克隆

即时语音克隆

# Clone from single sample (minimum 30 seconds recommended)
{baseDir}/scripts/clone.sh --name MyVoice recording.mp3

# Clone with description
{baseDir}/scripts/clone.sh --name BusinessVoice \
  --description 'Professional male voice' \
  sample.mp3

# Clone with labels
{baseDir}/scripts/clone.sh --name MyVoice \
  --labels '{"gender":"male","age":"adult"}' \
  sample.mp3

# Remove background noise during cloning
{baseDir}/scripts/clone.sh --name CleanVoice \
  --remove-bg-noise \
  sample.mp3

# Test cloned voice
{baseDir}/scripts/speak.sh --voice MyVoice 'Testing my cloned voice'

语音库管理

# List all available voices
{baseDir}/scripts/voices.sh list

# Get voice details
{baseDir}/scripts/voices.sh info --name Rachel
{baseDir}/scripts/voices.sh info --id 21m00Tcm4TlvDq8ikWAM

# Search voices (filter output with grep)
{baseDir}/scripts/voices.sh list | grep -i "female"

# Filter by category
{baseDir}/scripts/voices.sh list --category premade
{baseDir}/scripts/voices.sh list --category cloned

# Download voice preview
{baseDir}/scripts/voices.sh preview --name Rachel -o preview.mp3

# Delete custom voice
{baseDir}/scripts/voices.sh delete --id "voice_id"

音效

# Generate sound effect
{baseDir}/scripts/sfx.sh 'Heavy rain on a tin roof'

# With duration
{baseDir}/scripts/sfx.sh --duration 5 'Forest ambiance with birds'

# With prompt influence (higher = more accurate)
{baseDir}/scripts/sfx.sh --influence 0.8 'Sci-fi laser gun firing'

# Save to file
{baseDir}/scripts/sfx.sh --out effects/thunder.mp3 'Rolling thunder'

注意：时长范围为0.5至22秒（四舍五入至最近的0.5秒）

语音隔离

# Remove background noise and isolate voice
{baseDir}/scripts/isolate.sh noisy_recording.mp3

# Save to specific file
{baseDir}/scripts/isolate.sh --out clean_voice.mp3 meeting_recording.mp3

# Don't tag audio events
{baseDir}/scripts/isolate.sh --no-audio-events recording.mp3

要求：

最短时长：4.6秒
支持格式：MP3, WAV, M4A, OGG, FLAC

配音（多语言翻译）

# Dub audio to Spanish
{baseDir}/scripts/dub.sh --target es audio.mp3

# Dub with source language specified
{baseDir}/scripts/dub.sh --source en --target ja video.mp4

# Check dubbing status
{baseDir}/scripts/dub.sh --status --id "dubbing_id"

# Download dubbed audio
{baseDir}/scripts/dub.sh --download --id "dubbing_id" --out dubbed.mp3

支持语言：英语, 西班牙语, 法语, 德语, 意大利语, 葡萄牙语, 波兰语, 印地语, 阿拉伯语, 中文, 日语, 韩语, 荷兰语, 俄语, 土耳其语, 越南语, 瑞典语, 丹麦语, 芬兰语, 捷克语, 希腊语, 希伯来语, 印度尼西亚语, 马来语, 挪威语, 罗马尼亚语, 乌克兰语, 匈牙利语, 泰语

API使用示例

对于直接API访问，所有脚本底层都使用curl：

# Direct TTS API call
curl -X POST "https://api.elevenlabs.io/v1/text-to-speech/VOICE_ID" \
  -H "xi-api-key: $ELEVENLABS_API_KEY" \
  -H "Content-Type: application/json" \
  -d '{"text": "Hello world", "model_id": "eleven_turbo_v2_5"}' \
  --output speech.mp3

错误处理

所有脚本都提供有用的错误信息：

401：认证失败 - 请检查您的API密钥
403：权限被拒绝 - 您的API密钥可能没有访问权限
429：超出速率限制 - 请稍后再试
500/502/503：ElevenLabs API问题 - 请稍后重试

测试

运行测试套件以验证一切正常：

{baseDir}/test.sh YOUR_API_KEY

或使用环境变量：

export ELEVENLABS_API_KEY="your_key"
{baseDir}/test.sh

故障排除

常见问题

"执行主机不被允许（请求的网关）"
- 该技能需要在沙盒环境中运行命令
- 配置 OpenClaw 以使用沙盒：tools.exec.host: "sandbox"
- 或在您的 OpenClaw 配置中启用沙盒功能
- 替代方案：为网关主机配置执行批准（参见 OpenClaw 文档）
引号或感叹号导致的解析错误
- 使用单引号代替双引号：'Hello world'而不是"Hello world!"
- 使用双引号时避免在文本中使用感叹号（！）
- 对于复杂文本，请使用带有文件的--input选项
"未设置 ELEVENLABS_API_KEY"
- 确保ELEVENLABS_API_KEY已设置或在 openclaw.json 中配置
- 检查API密钥是否至少20个字符长
"需要jq但未安装"
- 安装jq：apt-get install jq（Linux）或brew install jq（macOS）
"超出速率限制"
- 请在elevenlabs.io/app/usage查看您的ElevenLabs计划配额
- 免费套餐：约每月10,000字符
"未找到语音"
- 使用{baseDir}/scripts/voices.sh list查看可用语音
- 检查语音ID是否正确
"配音失败"
- 确保源音频清晰可闻
- 检查支持的语言代码
"文件过大"
- 转录：最大100MB
- 配音：最大500MB
- 语音克隆：每个文件最大50MB

调试模式

# Enable verbose output
DEBUG=1 {baseDir}/scripts/speak.sh 'test'

# Show API request details
DEBUG=1 {baseDir}/scripts/transcribe.sh audio.mp3

定价说明

ElevenLabs API 定价（近似值）：

Flash v2.5：约 0.06 美元/分钟
Turbo v2.5：约 0.06 美元/分钟
多语言 v2：约 0.12 美元/分钟
语音克隆：包含在套餐内
音效：约 0.02 美元/次生成
转录：约 0.02 美元/分钟（Scribe v1）

免费套餐：约 10,000 字符/月

链接

免责申明

部分文章来自各大搜索引擎，如有侵权，请与我联系删除。

打赏

文章底部电脑广告

手机广告位-内容正文底部

标签

上一篇：Claude Code Agent技能使用说明下一篇：Linkedin - automation技能使用说明