MLX Audio Server技能使用说明
2026-03-30
新闻来源:网淘吧
围观:10
电脑广告
手机广告
MLX Audio Server
适用于 Mac 的本地 24x7 OpenAI 兼容 API 服务器,用于语音识别/语音合成,由 MLX 驱动。
mlx-audio:基于苹果 MLX 框架构建的最佳音频处理库,在 Apple Silicon 上提供快速高效的文本转语音、语音转文本以及语音转语音功能。

guoqiao/tap/mlx-audio-server:用于通过 Homebrew Formula 安装mlx-audio,并在 macOS 上以brew运行mlx_audio.server作为 LaunchAgent 服务。
要求
mlx:搭载 Apple Silicon 的 macOSbrew:用于安装依赖项(如果尚未安装)
安装
bash ${baseDir}/install.sh
此脚本将:
- 如果缺失,则通过 brew 安装 ffmpeg/jq。
- 安装 homebrew formula
mlx-audio-server来自guoqiao/tap - 启动 brew 服务以运行
mlx-audio-server
使用方法
STT/语音转文本(默认模型:mlx-community/glm-asr-nano-2512-8bit):
# input will be converted to wav with ffmpeg, if not yet.
# output will be transcript text only.
bash ${baseDir}/run_stt.sh <audio_or_video_path>
TTS/文本转语音(默认模型:mlx-community/Qwen3-TTS-12Hz-1.7B-VoiceDesign-bf16):
# audio will be saved into a tmp dir, with default name `speech.wav`, and print to stdout.
bash ${baseDir}/run_tts.sh "Hello, Human!"
# or you can specify a output dir
bash ${baseDir}/run_tts.sh "Hello, Human!" ./output
# output will be audio path only.
你可以直接使用这两个脚本,或将其作为示例/参考。
文章底部电脑广告
手机广告位-内容正文底部


微信扫一扫,打赏作者吧~