字典功能（Dictionary）

POST/v1/text_to_speech

该功能支持字典接入能力，帮助语音模型更准确的识别汉字对应的读音。

该功能的请求参数格式应为：纯文本或者TXT格式

请求参数

Query 参数

GroupId

string

必需

示例值:

$group_id

Header 参数

Authorization

string

必需

示例值:

Bearer $ {api_key}

Content-Type

string

必需

示例值:

application/json

voice_id

string

必需

如同时传入voice_id和timber_weights时，则会自动忽略voice_id，以timber_weights传递的参数为准

text

string

必需

如需要控制停顿时长，则增加输入<#X#>，X取值0.01-99.99，单位为秒，如：你<#5#>好（你与好中间停顿5秒）

model

string

必需

speed

integer

生成声音的语速

可选

可选，默认值为1.0取值越大，语速越快

vol

integer

生成声音的音量

可选

可选，默认值为1.0取值越大，音量越高

pitch

integer

生成声音的语调

可选

可选，默认值为0（0为原音色输出，取值需为整数）

timber_weights

array [object {2}]

音色相关信息

可选

音色相关信息，详见下方字段

voice_id

string

必需

weight

integer

必需

char_to_pitch

array[string]

替换需要特殊标注的文字、符号及对应的注音

可选

示例1，替换声调：["燕少飞/(yan4)(shao3)(fei1)"]示例2，替换字符：["omg/oh my god","=/等于"]声调用数字代替，一声（阴平）为1，二声（阳平）为2，三声（上声）为3，四声（去声）为4），轻声为5

{
    "voice_id": "male-qn-qingse",// 如同时传入voice_id和timber_weights时，则会自动忽略voice_id，以timber_weights传递的参数为准
    "text": "你好",//如需要控制停顿时长，则增加输入<#X#>，X取值0.01-99.99，单位为秒，如：你<#5#>好（你与好中间停顿5秒）
    "model": "speech-01",
    "speed": 1.0,
    "vol": 1.0,
    "pitch": 0,
    "timber_weights": [
        {
            "voice_id": "male-qn-qingse",
            "weight": 1
        },
        {
            "voice_id": "female-shaonv",
            "weight": 1
        },
        {
            "voice_id": "female-yujie",
            "weight": 1
        },
        {
            "voice_id": "audiobook_male_2",
            "weight": 1
        }
    ],
    "char_to_pitch": ["你/(ni1)"]
}

示例代码

返回响应

成功(200)

HTTP 状态码: 200

内容格式: JSONapplication/json

object {0}

{}

最后修改时间： 1 年前