T2A Pro API 接口

该接口支持基于自然语言交互生成回复的能力。接口本身为无状态接口，即单次调用时，模型所接收到的信息量仅为接口传入内容，不涉及业务逻辑，同时模型也不存储您传入的数据。

该接口支持以下功能：

1、支持单次合成最高50000字符输入；

2、支持语调、语速、音量、比特率、采样率相关参数调整特性；

3、支持音频时长、音频大小等返回参数；

4、支持时间戳（字幕）返回，精确到句；

5、支持混音功能，最多四种音色按照比例混合；

6、支持非法字符检测：非法字符不超过10%（包含10%），音频会正常生成并返回非法字符占比；非法字符超过10%，接口不返回结果（返回报错码），请检测后再次进行请求（非法字符定义：ascii码中的控制符（不含制表符和换行符））；

7、支持自定义文本与文本之间的语音时间间隔，以实现自定义文本语音停顿时间的效果。需要注意的是文本间隔时间需设置在两个发音的文本之间，且不能设置多个连续的时间间隔。

该接口的适用场景：长文本有声化、书籍小说等文字单章节语音合成、录播课程语音合成等。

curl --location --request POST 'http://dev-cn.your-api-server.com/v1/t2a_pro?GroupId= $group_id' \ --header 'Authorization: Bearer $ {api_key}' \ --header 'Content-Type: application/json' \ --data-raw '{ "voice_id": "male-qn-qingse", // 如同时传入voice_id和timber_weights时，则会自动忽略voice_id，以timber_weights传递的参数为准 "text": "你好", "model": "speech-01", "speed": 1.0, "vol": 1.0, "pitch": 0, "audio_sample_rate": 24000, "bitrate": 128000, "timber_weights": [ { "voice_id": "male-qn-qingse", "weight": 1 }, { "voice_id": "female-shaonv", "weight": 1 }, { "voice_id": "female-yujie", "weight": 1 }, { "voice_id": "audiobook_male_2", "weight": 1 } ] }'

{ "audio_file": "https://xxxxx/xxx.mp3", "subtitle_file": "https://xxxxx/xxx.titles", "trace_id": "xxxxxxxxxx", "extra_info": { "audio_length": 1946, "audio_sample_rate": 32000, "audio_size": 8253, "bitrate": 32000, "word_count": 10, "invisible_character_ratio": 0.04 }, "base_resp": { "status_code": 0, "status_msg": "success" } }

T2A Pro API 接口

请求参数

返回响应