T2A API接口
POST
/v1/text_to_speech3.2 返回(response)参数
- 请求成功
- 二进制音频信息
- Content-Type:audio/mpeg
- 请求失败
参数 | 语义 | 类型 | 备注 |
---|---|---|---|
base_resp | 如果请求出错,对应的错误状态码和详情 | ||
base_resp.status_code | 状态码 | int64 | 1000,未知错误1001,超时1002,触发限流1004,鉴权失败1013,服务内部错误2013,输入格式信息不正常 |
trace_id | 生成id | string | 用于在咨询/反馈时帮助定位问题 |
base_resp.status_msg | 错误详情 | string |
该接口支持基于自然语言交互生成回复的能力。接口本身为无状态接口,即单次调用时,模型所接收到的信息量仅为接口传入内容,不涉及业务逻辑,同时模型也不存储您传入的数据。
该接口支持以下功能:
1、支持音量、语调、语速调整;
2、支持混音功能;
3、支持固定间隔时间控制;
该接口的适用场景:短句生成、语音聊天、在线社交等
请求参数
该值应拼接在调用API的url末尾
如同时传入voice_id和timber_weights时,则会自动忽略voice_id,以timber_weights传递的参数为准
如需要控制停顿时长,则增加输入<#X#>,X取值0.01-99.99,单位为秒,如:你<#5#>好(你与好中间停顿5秒)
可选,默认值为1.0取值越大,语速越快
可选,默认值为1.0取值越大,音量越高
可选,默认值为0(0为原音色输出,取值需为整数)
音色相关信息,详见下方字段
支持系统音色(id)以及复刻音色(id)两种类型,其中系统音色(ID)如下:青涩青年音色(male-qn-qingse)精英青年音色(male-qn-jingying)霸道青年音色(male-qn-badao)青年大学生音色(male-qn-daxuesheng)少女音色(female-shaonv)御姐音色(female-yujie)成熟女性音色(female-chengshu)甜美女性音色(female-tianmei)男性主持人(presenter_male)女性主持人(presenter_female)男性有声书1(audiobook_male_1)男性有声书2(audiobook_male_2)女性有声书1(audiobook_female_1)女性有声书2(audiobook_female_2)青涩青年音色-beta(male-qn-qingse-jingpin)精英青年音色-beta(male-qn-jingying-jingpin)霸道青年音色-beta(male-qn-badao-jingpin)青年大学生音色-beta(male-qn-daxuesheng-jingpin)少女音色-beta(female-shaonv-jingpin)御姐音色-beta(female-yujie-jingpin)成熟女性音色-beta(female-chengshu-jingpin)甜美女性音色-beta(female-tianmei-jingpin)
最多支持4种音色混合,取值为整数,单一音色取值占比越高,合成音色越像;
{
"voice_id": "male-qn-qingse",// 如同时传入voice_id和timber_weights时,则会自动忽略voice_id,以timber_weights传递的参数为准
"text": "你好",//如需要控制停顿时长,则增加输入<#X#>,X取值0.01-99.99,单位为秒,如:你<#5#>好(你与好中间停顿5秒)
"model": "speech-01",
"speed": 1.0,
"vol": 1.0,
"pitch": 0,
"timber_weights": [
{
"voice_id": "male-qn-qingse",
"weight": 1
},
{
"voice_id": "female-shaonv",
"weight": 1
},
{
"voice_id": "female-yujie",
"weight": 1
},
{
"voice_id": "audiobook_male_2",
"weight": 1
}
]
}
示例代码
返回响应
{}