Vocal Chat
2026-03-29
新闻来源:网淘吧
围观:9
电脑广告
手机广告
对讲机模式
此功能利用本地转写和本地文本转语音技术,在WhatsApp上实现自动化的语音对语音循环。
工作流程
-
接收音频:当用户发送音频/ogg/opus文件时:
- 使用
tools/transcribe_voice.sh获取文本。 - 将文本作为普通用户提示进行处理。
- 使用
-
输出回复:
- 不回复文本,而是使用
bin/sherpa-onnx-tts生成语音。 - 将生成的
.ogg文件作为语音笔记发送回用户。
- 不回复文本,而是使用
触发条件
- 用户发送音频消息。
- 用户说出"activa modo walkie-talkie"(启动对讲机模式)或"hablemos por voz"(我们用语音聊吧)。
约束条件
- 仅使用本地工具(ffmpeg, whisper-cpp, sherpa-onnx-tts)。
- 维持较快的响应时间(RTF < 0.5)。
- 始终同时回复文本(用于清晰表达)和音频。
手动执行(内部)
若需手动以语音回复:
bin/sherpa-onnx-tts /tmp/reply.ogg "Tu mensaje aquí"
随后发送/tmp/reply.ogg通过消息工具,并携带filePath参数。
文章底部电脑广告
手机广告位-内容正文底部


微信扫一扫,打赏作者吧~