网淘吧来吧,欢迎您!

MoodCast技能使用说明

2026-04-01 新闻来源:网淘吧 围观:15
电脑广告
手机广告

MoodCast

将任何文本转化为富有情感表现力的音频,并配以环境音景。MoodCast分析您的内容,使用ElevenLabs v3音频标签添加富有表现力的演绎,并叠加匹配的环境音景。

何时使用此技能

当用户希望实现以下目标时,请使用MoodCast:

MoodCast

  • 聆听带有自然情感表达的文本朗读
  • 为文章、故事或脚本创建音频版本
  • 生成带有环境氛围的富有表现力的旁白
  • 收听真正引人入胜的晨间简报
  • 将枯燥的文本转化为引人入胜的音频内容

触发短语:"戏剧性地朗读这个"、"让它听起来更好听"、"为...创建音频"、"moodcast这个"、"带感情地朗读"、"叙述这个"

斜杠命令: /moodcast

核心功能

1. 情感感知文本增强

自动分析文本并插入适当的v3音频标签:

  • 情感: [兴奋][紧张][愤怒][悲伤][平静][快乐]表达方式:[低语][大喊][急促][放慢]
  • 反应: [大笑][叹息][倒吸一口气][咯咯笑][哭泣],[slows down]
  • Reactions: [laughs],[sighs],[gasps],[giggles],[crying]
  • 节奏控制: [停顿][呼吸声][结巴][犹豫]

2. 环境音效生成

使用音效API创建匹配的背景音频:

  • 新闻 → 微妙的办公室环境音
  • 故事 → 匹配情绪的氛围音景
  • 励志 → 振奋人心的背景音
  • 恐怖 → 紧张、诡异的氛围

3. 多角色对话

针对对话/剧本,为不同说话者分配不同音色,并配合恰当的情感表达。

操作指令

快速朗读(单指令)

python3 {baseDir}/scripts/moodcast.py --text "Your text here"

带环境音效

python3 {baseDir}/scripts/moodcast.py --text "Your text here" --ambient "coffee shop background noise"

保存至文件

python3 {baseDir}/scripts/moodcast.py --text "Your text here" --output story.mp3

不同情绪模式

python3 {baseDir}/scripts/moodcast.py --text "Your text" --mood dramatic
python3 {baseDir}/scripts/moodcast.py --text "Your text" --mood calm
python3 {baseDir}/scripts/moodcast.py --text "Your text" --mood excited
python3 {baseDir}/scripts/moodcast.py --text "Your text" --mood scary

列出可用音色

python3 {baseDir}/scripts/moodcast.py --list-voices

自定义配置

python3 {baseDir}/scripts/moodcast.py --text "Your text" --voice VOICE_ID --model eleven_v3 --output-format mp3_44100_128

情绪检测规则

该技能自动检测并增强:

文本模式添加音频标签
"amazing", "incredible", "wow"[兴奋]
"scared", "afraid", "terrified"[紧张]
"angry", "furious", "hate"[愤怒]
"sad", "sorry", "unfortunately"[悲伤]
"secret", "quiet", "between us"[耳语]
"!" 感叹号[兴奋]
"..." 省略号[停顿]
"haha", "lol"[笑声]
疑问句自然的升调

示例转换

输入:

Breaking news! Scientists have discovered something incredible. 
This could change everything we know about the universe...
I can't believe it.

增强输出:

[excited] Breaking news! Scientists have discovered something incredible.
[pause] This could change everything we know about the universe...
[gasps] [whispers] I can't believe it.

输入:

It was a dark night. The old house creaked. 
Something moved in the shadows...
"Who's there?" she whispered.

增强输出:

[slows down] It was a dark night. [pause] The old house creaked.
[nervous] Something moved in the shadows...
[whispers] "Who's there?" she whispered.

环境变量

  • ELEVENLABS_API_KEY(必需) - 您的 ElevenLabs API 密钥
  • MOODCAST_DEFAULT_VOICE(可选) - 默认语音 ID(默认为CwhRBWXzGAHq8TQ4Fs17
  • MOODCAST_MODEL(可选) - 默认模型 ID(默认为eleven_v3
  • MOODCAST_OUTPUT_FORMAT(可选) - 默认输出格式(默认为mp3_44100_128
  • MOODCAST_AUTO_AMBIENT(可选) - 设置为"true"以在使用--mood

时自动添加环境音效命令行参数会覆盖环境变量,而环境变量会覆盖硬编码的默认值。

技术说明

  • 使用 ElevenLabs 的 Eleven v3 模型以支持音频标签
  • 使用音效 API 生成环境音(最长 30 秒)
  • 免费套餐:每月 10,000 点数(约 10 分钟音频)
  • 每块文本最多 2,400 个字符(v3 模型支持 5,000,但为求可靠我们保守地进行了分段处理)
  • 音频标签必须为小写:[whispers]而非[WHISPERS]

最佳效果提示

  1. 戏剧性内容效果最佳——如故事、新闻、剧本
  2. 较短的段落(少于 500 字符)听起来更自然
  3. 结合环境音以获得沉浸式体验
  4. Roger 和 Rachel的声音在 v3 模型中表现力最强

致谢

由……构建ashutosh887
使用 ElevenLabs 文本转语音 v3 + 音效 API
为 #ClawdEleven 黑客松创作

免责申明
部分文章来自各大搜索引擎,如有侵权,请与我联系删除。
打赏

文章底部电脑广告
手机广告位-内容正文底部

相关文章

您是本站第394076名访客 今日有1篇新文章/评论