网淘吧来吧,欢迎您!

Phone Voice Agent

2026-03-30 新闻来源:网淘吧 围观:6
电脑广告
手机广告

电话代理技能

运行一个本地FastAPI服务器,充当实时语音桥接器。

架构

Twilio (Phone) <--> WebSocket (Audio) <--> [Local Server] <--> Deepgram (STT)
                                                  |
                                                  +--> OpenAI (LLM)
                                                  +--> ElevenLabs (TTS)

前提条件

  1. Twilio账户:电话号码 + TwiML应用程序。
  2. Deepgram API密钥:用于快速语音转文本。
  3. OpenAI API密钥:用于对话逻辑。
  4. ElevenLabs API密钥:用于逼真的文本转语音。
  5. Ngrok(或类似工具):用于将本地8080端口暴露给Twilio。

设置

  1. 安装依赖项

    Phone Voice Agent

    pip install -r scripts/requirements.txt
    
  2. 设置环境变量(在~/.moltbot/.env~/.clawdbot/.env文件中,或通过export命令设置):

    export DEEPGRAM_API_KEY="your_key"
    export OPENAI_API_KEY="your_key"
    export ELEVENLABS_API_KEY="your_key"
    export TWILIO_ACCOUNT_SID="your_sid"
    export TWILIO_AUTH_TOKEN="your_token"
    export PORT=8080
    
  3. 启动服务器:

    python3 scripts/server.py
    
  4. 暴露至互联网:

    ngrok http 8080
    
  5. 配置 Twilio:

    • 前往您的电话号码设置。
    • 将 "语音与传真" -> "来电时" 设置为Webhook
    • URL:https://<您的-ngrok-URL>.ngrok.io/incoming
    • 方法:POST

使用

拨打您的 Twilio 号码。智能体应接听电话,转录您的语音,思考,并以自然的声音回复。

自定义

  • 系统提示词: 编辑SYSTEM_PROMPTscripts/server.py以更改角色设定。
  • 语音: 更改ELEVENLABS_VOICE_ID使用不同的语音。
  • 模型: 切换gpt-4o-minigpt-4以获取更智能(但更慢)的响应。

免责申明
部分文章来自各大搜索引擎,如有侵权,请与我联系删除。
打赏
文章底部电脑广告
手机广告位-内容正文底部
上一篇:Skiplagged Flights 下一篇:Sophie Optimizer

相关文章

您是本站第323078名访客 今日有153篇新文章/评论