字典功能（Dictionary）

该功能支持字典接入能力，帮助语音模型更准确的识别汉字对应的读音。

该功能的请求参数格式应为：纯文本或者TXT格式

curl --location --request POST 'http://dev-cn.your-api-server.com/v1/text_to_speech?GroupId= $group_id' \ --header 'Authorization: Bearer $ {api_key}' \ --header 'Content-Type: application/json' \ --data-raw '{ "voice_id": "male-qn-qingse",// 如同时传入voice_id和timber_weights时，则会自动忽略voice_id，以timber_weights传递的参数为准 "text": "你好",//如需要控制停顿时长，则增加输入<#X#>，X取值0.01-99.99，单位为秒，如：你<#5#>好（你与好中间停顿5秒） "model": "speech-01", "speed": 1.0, "vol": 1.0, "pitch": 0, "timber_weights": [ { "voice_id": "male-qn-qingse", "weight": 1 }, { "voice_id": "female-shaonv", "weight": 1 }, { "voice_id": "female-yujie", "weight": 1 }, { "voice_id": "audiobook_male_2", "weight": 1 } ], "char_to_pitch": ["你/(ni1)"] }'

请求参数

Query 参数

GroupId

string

必需

示例值:

$group_id

Header 参数

Authorization

string

必需

示例值:

Bearer $ {api_key}

Content-Type

string

必需

示例值:

application/json

Body 参数application/json

voice_id

string

请求的音色编号

可选

如同时传入voice_id和timber_weights时，则会自动忽略voice_id，以timber_weights传递的参数为准

text

string

期望生成声音的文本

必需

如需要控制停顿时长，则增加输入<#X#>，X取值0.01-99.99，单位为秒，如：你<#5#>好（你与好中间停顿5秒）需要注意的是文本间隔时间需设置在两个可以语音发音的文本之间，且不能设置多个连续的时间间隔。

model

string

必需

speed

integer

生成声音的语速

可选

可选，默认值为1.0取值越大，语速越快

vol

integer

生成声音的音量

可选

可选，默认值为1.0取值越大，音量越高

pitch

integer

生成声音的语调

可选

可选，默认值为0（0为原音色输出，取值需为整数）

timber_weights

array [object {2}]

音色相关信息

可选

音色相关信息，详见下方字段

voice_id

string

必需

weight

integer

必需

char_to_pitch

array[string]

替换需要特殊标注的文字、符号及对应的注音

可选

示例1，替换声调：["燕少飞/(yan4)(shao3)(fei1)"]示例2，替换字符：["omg/oh my god","=/等于"]声调用数字代替，一声（阴平）为1，二声（阳平）为2，三声（上声）为3，四声（去声）为4），轻声为5

示例

字典功能（Dictionary）

请求参数

返回响应