本地语音统一面板

当前正在使用 F5-TTS。现在 TTS 和 ASR 都共用这一个入口,你可以随时在顶部切换。

当前是按需模式。平时只保留 Web 服务,生成时才临时加载模型,结束后自动退出推理进程。

按需模式

运行模式

运行模式按模型分别管理。偶尔生成时保持按需模式更省资源;连续试音很多次时,再临时开启常驻模式会更顺手。

生成语音

常用参数

做音色克隆时建议填写,模型会更容易对齐语气和时长。
高级参数
这些参数更适合你在已经能正常出声后,继续细调风格、速度和复现性时再动。
常驻模式下会固定使用预加载模型;如果你要切换 4-bit 或 8-bit,先关闭常驻模式再生成。

最近生成

接口调用

你之后也可以把当前模型当本地 API 用。

POST /api/tts/f5 Content-Type: application/json { "text": "你好,这是接口测试", "output_name": "api-test.wav", "steps": 8, "speed": 1.0, "quantization_bits": 4 }