@@ -296,3 +296,69 @@ MiniMax提供的在线的TTS服务,`speech-02-turbo`等模型具有强大的TT
296296 pronunciation_dict: ''
297297` ` `
298298其中`voice_id`是可以配置的声音音色,具体的支持声音列表可以查看[官方文档中查询可用声音ID的部分](https://platform.minimaxi.com/document/get_voice)。`pronunciation_dict`是可以支持的自定义发声规则,比如您可以把`牛肉`发音为`neuro`,可以用类似示例的方法来定义这个发声规则。
299+
300+ # # ElevenLabs TTS (在线,需要API密钥)
301+ > 自版本 `v1.2.1` 起可用
302+
303+ ElevenLabs 提供高质量、自然流畅的文本转语音服务,支持多种语言和声音克隆功能。
304+
305+ # ## 功能特点
306+ - **高质量音频**:行业领先的语音合成质量
307+ - **多语言支持**:支持英语、中文、日语、韩语等多种语言
308+ - **声音克隆**:上传音频样本进行声音克隆
309+ - **丰富的语音库**:提供多种预设语音和社区语音
310+ - **实时生成**:低延迟语音合成
311+
312+ # ## 配置步骤
313+ 1. **注册并获取API密钥**
314+ - 访问 [ElevenLabs](https://elevenlabs.io/) 注册账户
315+ - 从 ElevenLabs 控制台获取您的 API 密钥
316+
317+ 2. **选择语音**
318+ - 在 ElevenLabs 控制台中浏览可用语音
319+ - 复制您喜欢的语音的 Voice ID
320+ - 您也可以上传音频样本进行声音克隆
321+
322+ 3. **配置 `conf.yaml`**
323+ 在配置文件的 `elevenlabs_tts` 段落中,按以下格式填写参数:
324+
325+ ` ` ` yaml
326+ elevenlabs_tts:
327+ api_key: 'your_elevenlabs_api_key' # 必需:您的 ElevenLabs API 密钥
328+ voice_id: 'JBFqnCBsd6RMkjVDRZzb' # 必需:ElevenLabs 语音 ID
329+ model_id: 'eleven_multilingual_v2' # 模型 ID(默认:eleven_multilingual_v2)
330+ output_format: 'mp3_44100_128' # 输出音频格式(默认:mp3_44100_128)
331+ stability: 0.5 # 语音稳定性(0.0 到 1.0,默认:0.5)
332+ similarity_boost: 0.5 # 语音相似度增强(0.0 到 1.0,默认:0.5)
333+ style: 0.0 # 语音风格夸张度(0.0 到 1.0,默认:0.0)
334+ use_speaker_boost: true # 启用说话人增强以获得更好质量(默认:true)
335+ ` ` `
336+
337+ # ## 参数说明
338+ - **api_key**(必需):您的 ElevenLabs API 密钥
339+ - **voice_id**(必需):语音的唯一标识符,在 ElevenLabs 控制台中找到
340+ - **model_id**:要使用的 TTS 模型。可用选项:
341+ - ` eleven_multilingual_v2` (默认)- 支持多种语言
342+ - ` eleven_monolingual_v1` - 仅英语
343+ - ` eleven_turbo_v2` - 更快的生成速度
344+ - **output_format**:音频输出格式。常用选项:
345+ - ` mp3_44100_128` (默认)- MP3,44.1kHz,128kbps
346+ - ` mp3_44100_192` - MP3,44.1kHz,192kbps
347+ - ` pcm_16000` - PCM,16kHz
348+ - ` pcm_22050` - PCM,22.05kHz
349+ - ` pcm_24000` - PCM,24kHz
350+ - ` pcm_44100` - PCM,44.1kHz
351+ - **stability**:控制语音一致性(0.0 = 更多变化,1.0 = 更一致)
352+ - **similarity_boost**:增强与原始语音的相似度(0.0 到 1.0)
353+ - **style**:控制风格夸张度(0.0 = 中性,1.0 = 更具表现力)
354+ - **use_speaker_boost**:启用说话人增强以提高音频质量
355+
356+ # ## 使用技巧
357+ - **语音选择**:先尝试预设语音,然后考虑使用声音克隆获得自定义语音
358+ - **参数调优**:调整 `stability` 和 `similarity_boost` 以获得最佳效果
359+ - **成本管理**:ElevenLabs 按使用量收费,大量使用前请先测试
360+ - **网络要求**:需要稳定的网络连接以确保服务可用
361+
362+ :::tip
363+ ElevenLabs 提供免费试用额度,您可以在购买付费计划前先测试质量。
364+ :: :
0 commit comments