Edge TTS
2026-03-25
新闻来源:网淘吧
围观:54
电脑广告
手机广告
Edge-TTS 技能
概述
通过 node-edge-tts npm 包,使用 Microsoft Edge 的神经 TTS 服务生成高质量的文本转语音音频。支持多种语言、语音、可调节速度/音高以及字幕生成。
快速开始
当你从触发器或用户请求中检测到 TTS 意图时:
- 调用 tts 工具(Clawdbot 内置)将文本转换为语音
- 该工具返回一个 MEDIA: 路径
- Clawdbot 将音频路由到当前频道
// 示例:内置 tts 工具用法
tts("您要转换为语音的文本")
// 返回:MEDIA: /path/to/audio.mp3
触发器检测
将 "tts" 关键字识别为 TTS 请求。该技能在转换前会自动过滤掉文本中与 TTS 相关的关键字,以避免将触发器词本身转换为音频。
高级自定义
使用 Node.js 脚本
为了获得更多控制,可以直接使用捆绑的脚本:
TTS 转换器
cd scripts
npm install
node tts-converter.js "您的文本" --voice en-US-AriaNeural --rate +10% --output output.mp3
选项:
--voice, -v: 语音名称(默认:en-US-AriaNeural)--lang, -l: 语言代码(例如,en-US, es-ES)--format, -o: 输出格式(默认:audio-24khz-48kbitrate-mono-mp3)--pitch音高调整(例如:+10%、-20%、默认)--rate, -r:语速调整(例如:+10%、-20%、默认)--volume:音量调整(例如:+0%、-10%、默认)--save-subtitles, -s:将字幕保存为JSON文件--output, -f:输出文件路径(默认:tts_output.mp3)--proxy, -p:代理URL(例如:http://localhost:7890)--timeout:请求超时时间(毫秒)(默认:10000)--list-voices, -L:列出可用语音
配置管理器
cd scripts
npm install
node config-manager.js --set-voice en-US-AriaNeural
node config-manager.js --set-rate +10%
node config-manager.js --get
node config-manager.js --reset
语音选择
常用语音(使用--list-voices查看完整列表):
英语:
en-US-MichelleNeural(女性,自然,默认)en-US-AriaNeural(女性,自然)en-US-GuyNeural(男性,自然)en-GB-SoniaNeural(女性,英式英语)en-GB-RyanNeural(男性,英式英语)
其他语言:
es-ES-ElviraNeural(西班牙语,西班牙)fr-FR-DeniseNeural(法语)de-DE-KatjaNeural(德语)ja-JP-NanamiNeural(日语)zh-CN-XiaoxiaoNeural(中文)ar-SA-ZariyahNeural(阿拉伯语)
评分指南
速率值使用百分比格式:
"default":正常速度"-20%"至"-10%":缓慢、清晰(教程、故事、辅助功能)"+10%"至"+20%":稍快(摘要)"+30%"至"+50%":快速(新闻、效率)
输出格式
根据使用场景选择音频质量:
audio-24khz-48kbitrate-mono-mp3:标准质量(语音笔记、消息)audio-24khz-96kbitrate-mono-mp3:高质量(演示文稿、内容)audio-48khz-96kbitrate-stereo-mp3:最高质量(专业音频、音乐)
资源
scripts/tts-converter.js
使用node-edge-tts的主要TTS转换脚本。可生成具有可自定义语音、语速、音量、音调和格式的音频文件。支持字幕生成和语音列表。
scripts/config-manager.js
管理TTS设置的持久化用户偏好(语音、语言、格式、音调、语速、音量)。将配置存储在~/.tts-config.json文件中。
scripts/package.json
包含node-edge-tts依赖项的NPM包配置。
references/node_edge_tts_guide.md
node-edge-tts npm包的完整文档,包括:
- 按语言分类的完整语音列表
- 韵律选项(语速、音调、音量)
- 使用示例(命令行和模块)
- 字幕生成
- 输出格式
- 最佳实践和限制
语音测试
测试不同语音并预览音频质量,请访问:https://tts.travisvn.com/
当您需要特定语音详细信息或高级功能时,请参考此链接。
安装
要使用捆绑的脚本:
cd /home/user/clawd/skills/public/tts-skill/scripts
npm install
这将安装:
node-edge-tts- TTS库指挥官- CLI 参数解析
工作流程
- 检测意图:检查用户消息中是否包含"tts"触发器或关键词
- 选择方法:对于简单请求使用内置的
tts工具,或使用scripts/tts-converter.js进行自定义设置 - 生成音频:转换目标文本(消息、搜索结果、摘要)
- 返回给用户:tts工具返回一个MEDIA:路径;Clawdbot处理交付
测试
基础测试
运行测试脚本以验证TTS功能:
cd /home/user/clawd/skills/public/edge-tts/scripts
npm test
这将生成一个测试音频文件并验证TTS服务是否正常工作。
语音测试
测试不同语音并在以下网址预览音频质量:https://tts.travisvn.com/
集成测试
使用内置的文本转语音快速测试工具:
// 示例:使用默认设置测试TTS功能
tts("这是对TTS功能的测试。")
配置测试
验证配置持久性:
cd /home/user/clawd/skills/public/edge-tts/scripts
node config-manager.js --get
node config-manager.js --set-voice en-US-GuyNeural
node config-manager.js --get
故障排除
- 测试连接性:运行
npm test以检查TTS服务是否可访问 - 检查语音可用性:使用
node tts-converter.js --list-voices以查看可用语音 - 验证代理设置:如果使用代理,请使用以下命令测试
node tts-converter.js "test" --proxy http://localhost:7890 - 检查音频输出:测试应在脚本目录中生成
test-output.mp3文件
注意事项
- node-edge-tts 使用微软Edge的在线TTS服务(已更新,身份验证有效)
- 无需API密钥(免费服务)
- 默认输出为MP3格式
- 需要网络连接
- 支持字幕生成(JSON格式,含逐词时间戳)
- 临时文件处理:默认情况下,音频文件会保存至系统临时目录(
Unix系统为/tmp/edge-tts-temp/,Windows系统为C:\Users\<用户>\AppData\Local\Temp\edge-tts-temp\)并采用唯一文件名(例如tts_1234567890_abc123.mp3)。文件不会自动删除——调用程序(Clawdbot)应在使用后自行清理。如需永久存储,可通过--output选项指定自定义输出路径。 - TTS关键词过滤:该功能会在文本转换前自动过滤TTS相关关键词(tts、TTS、text-to-speech),避免将触发词本身转为音频
- 如需设置重复使用的偏好项,请通过
config-manager.js设定默认值 - 默认语音:
en-US-MichelleNeural(女声,自然音质) - 神经语音(以
Neural结尾)比标准语音质量更高
文章底部电脑广告
手机广告位-内容正文底部
上一篇:Debug Pro
下一篇:Answer Overflow


微信扫一扫,打赏作者吧~