TTS 服务器现在支持 54 个不同的声音,包括美式、英式、法语、日语和中文等多种语言和口音。
POST http://localhost:9527/synthesize
Content-Type: application/json
{
"text": "Hello world",
"voice": "am_michael" # 可选参数
}| 参数 | 类型 | 必需 | 默认值 | 说明 |
|---|---|---|---|---|
text |
string | ✅ | - | 要合成的文本 |
voice |
string | ❌ | af_alloy |
声音名称 |
format |
string | ❌ | wav |
音频格式 |
{
"file_id": "52efa9a9c840e992",
"url": "http://localhost:9527/audio/52efa9a9c840e992.wav",
"cached": false
}af_alloy- Alloy (默认女声)af_aoede- Aoedeaf_bella- Bellaaf_heart- Heartaf_jessica- Jessicaaf_kore- Koreaf_nicole- Nicoleaf_nova- Novaaf_river- Riveraf_sarah- Sarahaf_sky- Sky
am_adam- Adamam_echo- Echoam_eric- Ericam_fenrir- Fenriram_liam- Liamam_michael- Michael ⭐ (推荐用于标准美音)am_onyx- Onyxam_puck- Puckam_santa- Santa
bf_alice- Alicebf_emma- Emmabf_isabella- Isabellabf_lily- Lily
bm_daniel- Danielbm_fable- Fablebm_george- George ⭐ (推荐用于英式发音)bm_lewis- Lewis
ff_siwis- Siwis (女声)
jf_alpha- Alpha (女声)jf_gongitsune- Gongitsune (女声)jf_nezumi- Nezumi (女声)jf_tebukuro- Tebukuro (女声)jm_kumo- Kumo (男声)
zf_xiaobei- 小贝zf_xiaoni- 小妮zf_xiaoxiao- 小小zf_xiaoyi- 小艺
zm_yunjian- 云健zm_yunxi- 云希zm_yunxia- 云霞zm_yunyang- 云扬
ef_dora,em_alex,em_santa- 其他欧洲语言hf_alpha,hf_beta,hm_omega,hm_psi- Hindiif_sara,im_nicola- Italianpf_dora,pm_alex,pm_santa- Portuguese
curl -X POST "http://localhost:9527/synthesize" \
-H "Content-Type: application/json" \
-d '{"text": "Hello world"}'# 美式男声 Michael
curl -X POST "http://localhost:9527/synthesize" \
-H "Content-Type: application/json" \
-d '{"text": "death", "voice": "am_michael"}'
# 英式男声 George
curl -X POST "http://localhost:9527/synthesize" \
-H "Content-Type: application/json" \
-d '{"text": "death", "voice": "bm_george"}'const response = await fetch('http://localhost:9527/synthesize', {
method: 'POST',
headers: {
'Content-Type': 'application/json'
},
body: JSON.stringify({
text: 'Hello world',
voice: 'bm_george' // 可选
})
});
const result = await response.json();
// result.url: 音频文件 URL根据不同使用场景的推荐:
| 场景 | 推荐声音 | 说明 |
|---|---|---|
| 英文单词学习 | bm_george, bm_daniel |
英式发音更清晰 |
| 美式英语 | am_michael, am_adam |
标准美音 |
| 女声朗读 | af_nova, af_sarah |
声音自然清晰 |
| 中文朗读 | zf_xiaoxiao, zm_yunxi |
普通话标准 |
- 缓存键基于 文本 + 声音 的组合
- 相同文本不同声音会生成不同的音频文件
- 缓存有效期: 1 小时 (3600秒)
- 缓存目录:
cache/audio/
- 首次合成: ~3-5秒 (包含模型加载)
- 后续合成: ~1-2秒
- 缓存命中: ~10ms
- 所有 54 个声音在服务器启动时一次性加载