T2A Stream(流式语音生成)
GET
https://api.minimax.chat/v1/tts/stream本接口支持基于自然语言交互生成回复的能力。
本接口本身为无状态接口,即单次调用时,模型所接收到的信息量仅为接口传入内容,不涉及业务逻辑,同时模型也不存储您传入的数据。
本接口适用场景:语音通话、语音聊天等需求流式的相关场景
本接口为流式输出接口,支持以下功能:
- 支持单次合成500字符输入;
- 支持语调、语速、音量、比特率、采样率相关参数调整特性;
- 支持音频时长、音频大小等返回参数;
- 支持混音功能,最多四种音色按照比例混合;
- 支持非法字符检测:非法字符不超过10%(包含10%),音频会正常生成并返回非法字符占比;非法字符超过10%,接口不返回结果(返回报错码),请检测后再次进行请求(非法字符定义:ascii码中的控制符(不含制表符和换行符));
请求参数
该值应拼接在调用API的url末尾
如同时传入voice_id和timber_weights时,则会自动忽略voice_id,以timber_weights传递的参数为准
支持自定义文本与文本之间的语音时间间隔,以实现自定义文本语音停顿时间的效果。需要注意的是文本间隔时间需设置在两个可以语音发音的文本之间,且不能设置多个连续的时间间隔。
可选,默认值为1.0取值越大,语速越快
可选,默认值为1.0取值越大,音量越高
可选,默认值为0(0为原音色输出,取值需为整数)
可选,默认为24000
可选,默认值为128000
音色相关信息,详见下方字段
暂时只支持系统音色(id):青涩青年音色(male-qn-qingse)精英青年音色(male-qn-jingying)霸道青年音色(male-qn-badao)青年大学生音色(male-qn-daxuesheng)少女音色(female-shaonv)御姐音色(female-yujie)成熟女性音色(female-chengshu)甜美女性音色(female-tianmei)男性主持人(presenter_male)女性主持人(presenter_female)男性有声书1(audiobook_male_1)男性有声书2(audiobook_male_2)女性有声书1(audiobook_female_1)女性有声书2(audiobook_female_2)青涩青年音色-beta(male-qn-qingse-jingpin)精英青年音色-beta(male-qn-jingying-jingpin)霸道青年音色-beta(male-qn-badao-jingpin)青年大学生音色-beta(male-qn-daxuesheng-jingpin)少女音色-beta(female-shaonv-jingpin)御姐音色-beta(female-yujie-jingpin)成熟女性音色-beta(female-chengshu-jingpin)甜美女性音色-beta(female-tianmei-jingpin)
最多支持4种音色混合,取值为整数,单一音色取值占比越高,合成音色越像;
{
"voice_id": "string",
"text": "string",
"model": "string",
"speed": 0,
"vol": 0,
"pitch": 0,
"audio_sample_rate": 0,
"bitrate": 0,
"timber_weights": [
{
"voice_id": "string",
"weight": 0
}
]
}
示例代码
返回响应
用于在咨询/反馈时帮助定位问题
格式为mp3
音频文件对应的字幕,精确到句(不超过50字),单位为毫秒,格式为json
相关额外信息
音频时长,精确到毫秒
默认为24000,如客户请求参数进行调整,会根据请求参数生成
单位为字节
默认为168000,如客户请求参数进行调整,会根据请求参数生成
已经发音的字数统计(不算标点等其他符号,包含汉字数字字母)
非法字符不超过10%(包含10%),音频会正常生成并返回非法字符占比;最大不超过0.1(10%),超过进行报错
{
"data": {
"audio": "hex编码的audio_chunk1 + hex编码的audio_chunk2 + hex编码的audio_chunk3",
"status": 2,
"ced": ""
},
"extra_info": {
"audio_length": 5746,
"audio_sample_rate": 32000,
"audio_size": 100845,
"bitrate": 128000,
"word_count": 32,
"invisible_character_ratio": 0
},
"trace_id": "01b8bf9bb7433cc75c18eee6cfa8fe21",
"base_resp": {
"status_code": 0,
"status_msg": ""
}
}