字典功能(Dictionary)
POST
/v1/text_to_speech该功能支持字典接入能力,帮助语音模型更准确的识别汉字对应的读音。
该功能的请求参数格式应为:纯文本或者TXT格式
请求参数
Query 参数
GroupId
string
必需
示例值:
$group_id
Header 参数
Authorization
string
必需
示例值:
Bearer $
{api_key}
Content-Type
string
必需
示例值:
application/json
Body 参数application/json
voice_id
string
必需
如同时传入voice_id和timber_weights时,则会自动忽略voice_id,以timber_weights传递的参数为准
text
string
必需
如需要控制停顿时长,则增加输入<#X#>,X取值0.01-99.99,单位为秒,如:你<#5#>好(你与好中间停顿5秒)
model
string
必需
speed
integer
生成声音的语速
可选,默认值为1.0取值越大,语速越快
vol
integer
生成声音的音量
可选,默认值为1.0取值越大,音量越高
pitch
integer
生成声音的语调
可选,默认值为0(0为原音色输出,取值需为整数)
timber_weights
array [object {2}]
音色相关信息
音色相关信息,详见下方字段
voice_id
string
必需
weight
integer
必需
char_to_pitch
array[string]
替换需要特殊标注的文字、符号及对应的注音
示例1,替换声调:["燕少飞/(yan4)(shao3)(fei1)"]示例2,替换字符:["omg/oh my god","=/等于"]声调用数字代替,一声(阴平)为1,二声(阳平)为2,三声(上声)为3,四声(去声)为4),轻声为5
示例
{
"voice_id": "male-qn-qingse",// 如同时传入voice_id和timber_weights时,则会自动忽略voice_id,以timber_weights传递的参数为准
"text": "你好",//如需要控制停顿时长,则增加输入<#X#>,X取值0.01-99.99,单位为秒,如:你<#5#>好(你与好中间停顿5秒)
"model": "speech-01",
"speed": 1.0,
"vol": 1.0,
"pitch": 0,
"timber_weights": [
{
"voice_id": "male-qn-qingse",
"weight": 1
},
{
"voice_id": "female-shaonv",
"weight": 1
},
{
"voice_id": "female-yujie",
"weight": 1
},
{
"voice_id": "audiobook_male_2",
"weight": 1
}
],
"char_to_pitch": ["你/(ni1)"]
}
示例代码
返回响应
成功(200)
HTTP 状态码: 200
内容格式: JSONapplication/json
数据结构
object {0}
示例
{}
最后修改时间: 1 年前