Edge TTS技能使用说明

2026-03-25 新闻来源：网淘吧围观:283

电脑广告

手机广告

Edge-TTS 技能

概述

通过 node-edge-tts npm 包，使用 Microsoft Edge 的神经 TTS 服务生成高质量的文本转语音音频。支持多种语言、语音、可调节速度/音高以及字幕生成。

快速开始

当你从触发器或用户请求中检测到 TTS 意图时：

调用 tts 工具（Clawdbot 内置）将文本转换为语音
该工具返回一个 MEDIA: 路径
Clawdbot 将音频路由到当前频道

// 示例：内置 tts 工具用法
tts("您要转换为语音的文本")
// 返回：MEDIA: /path/to/audio.mp3

触发器检测

将 "tts" 关键字识别为 TTS 请求。该技能在转换前会自动过滤掉文本中与 TTS 相关的关键字，以避免将触发器词本身转换为音频。

高级自定义

使用 Node.js 脚本

为了获得更多控制，可以直接使用捆绑的脚本：

TTS 转换器

cd scripts
npm install
node tts-converter.js "您的文本" --voice en-US-AriaNeural --rate +10% --output output.mp3

选项：

--voice， -v: 语音名称（默认：en-US-AriaNeural）
--lang, -l: 语言代码（例如，en-US, es-ES）
--format, -o: 输出格式（默认：audio-24khz-48kbitrate-mono-mp3）
--pitch音高调整（例如：+10%、-20%、默认）
--rate, -r：语速调整（例如：+10%、-20%、默认）
--volume：音量调整（例如：+0%、-10%、默认）
--save-subtitles, -s：将字幕保存为JSON文件
--output, -f：输出文件路径（默认：tts_output.mp3）
--proxy, -p：代理URL（例如：http://localhost:7890）
--timeout：请求超时时间（毫秒）（默认：10000）
--list-voices, -L：列出可用语音

配置管理器

cd scripts
npm install
node config-manager.js --set-voice en-US-AriaNeural

node config-manager.js --set-rate +10%

node config-manager.js --get

node config-manager.js --reset

语音选择

常用语音（使用--list-voices查看完整列表）：

英语：

en-US-MichelleNeural（女性，自然，默认)
en-US-AriaNeural（女性，自然）
en-US-GuyNeural（男性，自然）
en-GB-SoniaNeural（女性，英式英语）
en-GB-RyanNeural（男性，英式英语）

其他语言：

es-ES-ElviraNeural（西班牙语，西班牙）
fr-FR-DeniseNeural（法语）
de-DE-KatjaNeural（德语）
ja-JP-NanamiNeural（日语）
zh-CN-XiaoxiaoNeural（中文）
ar-SA-ZariyahNeural（阿拉伯语）

评分指南

速率值使用百分比格式：

"default"：正常速度
"-20%"至"-10%"：缓慢、清晰（教程、故事、辅助功能）
"+10%"至"+20%"：稍快（摘要）
"+30%"至"+50%"：快速（新闻、效率）

输出格式

根据使用场景选择音频质量：

audio-24khz-48kbitrate-mono-mp3：标准质量（语音笔记、消息）
audio-24khz-96kbitrate-mono-mp3：高质量（演示文稿、内容）
audio-48khz-96kbitrate-stereo-mp3：最高质量（专业音频、音乐）

资源

scripts/tts-converter.js

使用node-edge-tts的主要TTS转换脚本。可生成具有可自定义语音、语速、音量、音调和格式的音频文件。支持字幕生成和语音列表。

scripts/config-manager.js

管理TTS设置的持久化用户偏好（语音、语言、格式、音调、语速、音量）。将配置存储在~/.tts-config.json文件中。

scripts/package.json

包含node-edge-tts依赖项的NPM包配置。

references/node_edge_tts_guide.md

node-edge-tts npm包的完整文档，包括：

按语言分类的完整语音列表
韵律选项（语速、音调、音量）
使用示例（命令行和模块）
字幕生成
输出格式
最佳实践和限制

语音测试

测试不同语音并预览音频质量，请访问：https://tts.travisvn.com/

当您需要特定语音详细信息或高级功能时，请参考此链接。

安装

要使用捆绑的脚本：

cd /home/user/clawd/skills/public/tts-skill/scripts
npm install

这将安装：

node-edge-tts- TTS库
指挥官- CLI 参数解析

工作流程

检测意图：检查用户消息中是否包含"tts"触发器或关键词
选择方法：对于简单请求使用内置的tts工具，或使用scripts/tts-converter.js进行自定义设置
生成音频：转换目标文本（消息、搜索结果、摘要）
返回给用户：tts工具返回一个MEDIA:路径；Clawdbot处理交付

测试

基础测试

运行测试脚本以验证TTS功能：

cd /home/user/clawd/skills/public/edge-tts/scripts
npm test

这将生成一个测试音频文件并验证TTS服务是否正常工作。

语音测试

测试不同语音并在以下网址预览音频质量：https://tts.travisvn.com/

集成测试

使用内置的文本转语音快速测试工具：

// 示例：使用默认设置测试TTS功能
tts("这是对TTS功能的测试。")

配置测试

验证配置持久性：

cd /home/user/clawd/skills/public/edge-tts/scripts
node config-manager.js --get
node config-manager.js --set-voice en-US-GuyNeural
node config-manager.js --get

故障排除

测试连接性：运行npm test以检查TTS服务是否可访问
检查语音可用性：使用node tts-converter.js --list-voices以查看可用语音
验证代理设置：如果使用代理，请使用以下命令测试node tts-converter.js "test" --proxy http://localhost:7890
检查音频输出：测试应在脚本目录中生成test-output.mp3文件

注意事项

node-edge-tts 使用微软Edge的在线TTS服务（已更新，身份验证有效）
无需API密钥（免费服务）
默认输出为MP3格式
需要网络连接
支持字幕生成（JSON格式，含逐词时间戳）
临时文件处理：默认情况下，音频文件会保存至系统临时目录（Unix系统为/tmp/edge-tts-temp/，Windows系统为C:\Users\<用户>\AppData\Local\Temp\edge-tts-temp\）并采用唯一文件名（例如tts_1234567890_abc123.mp3）。文件不会自动删除——调用程序（Clawdbot）应在使用后自行清理。如需永久存储，可通过--output选项指定自定义输出路径。
TTS关键词过滤：该功能会在文本转换前自动过滤TTS相关关键词（tts、TTS、text-to-speech），避免将触发词本身转为音频
如需设置重复使用的偏好项，请通过config-manager.js设定默认值
默认语音：en-US-MichelleNeural（女声，自然音质）
神经语音（以Neural结尾）比标准语音质量更高

天猫隐藏优惠券

网淘吧

免责申明

部分文章来自各大搜索引擎，如有侵权，请与我联系删除。

打赏

文章底部电脑广告

手机广告位-内容正文底部

标签

上一篇：Debug Pro技能使用说明下一篇：Answer Overflow技能使用说明

Edge TTS技能使用说明

Edge-TTS 技能

概述

快速开始

触发器检测

高级自定义

使用 Node.js 脚本

TTS 转换器

配置管理器

语音选择

评分指南

输出格式

资源

scripts/tts-converter.js

scripts/config-manager.js

scripts/package.json

references/node_edge_tts_guide.md

语音测试

安装

工作流程

测试

基础测试

语音测试

集成测试

配置测试

故障排除

注意事项

相关文章

推荐文章

热门浏览

标签列表