T2A Stream（流式语音生成）

开发环境

http://dev-cn.your-api-server.com

GET

https://api.minimax.chat/v1/tts/stream

本接口支持基于自然语言交互生成回复的能力。

本接口本身为无状态接口，即单次调用时，模型所接收到的信息量仅为接口传入内容，不涉及业务逻辑，同时模型也不存储您传入的数据。

本接口适用场景：语音通话、语音聊天等需求流式的相关场景

本接口为流式输出接口，支持以下功能：

支持单次合成500字符输入；

支持语调、语速、音量、比特率、采样率相关参数调整特性；

支持音频时长、音频大小等返回参数；

支持混音功能，最多四种音色按照比例混合；

支持非法字符检测：非法字符不超过10%（包含10%），音频会正常生成并返回非法字符占比；非法字符超过10%，接口不返回结果（返回报错码），请检测后再次进行请求（非法字符定义：ascii码中的控制符（不含制表符和换行符））；

请求参数

Query 参数

Header 参数

Body 参数application/json

示例

返回响应

🟢200结束

application/json

Bodyapplication/json

🟢200返回的第三个chunk

🟢200/返回的第二个chunk

🟢200返回的第一个chunk

🟠400请求有误

请求示例

Shell

JavaScript

Java

Swift

curl --location --request GET 'https://api.minimax.chat/v1/tts/stream?GroupId=undefined' \
--header 'Authorization;' \
--header 'header;' \
--header 'Content-Type: application/json' \
--data '{
    "voice_id": "string",
    "text": "string",
    "model": "string",
    "speed": 0,
    "vol": 0,
    "pitch": 0,
    "audio_sample_rate": 0,
    "bitrate": 0,
    "timber_weights": [
        {
            "voice_id": "string",
            "weight": 0
        }
    ]
}'

响应示例

200 - 示例 1

{
    "data": {
        "audio": "string",
        "status": 0,
        "ced": "string"
    },
    "extra_info": {
        "audio_length": 0,
        "audio_sample_rate": 0,
        "audio_size": 0,
        "bitrate": 0,
        "word_count": 0,
        "invisible_character_ratio": 0
    },
    "trace_id": "string",
    "base_resp": {
        "status_code": 0,
        "status_msg": "string"
    }
}

修改于 2024-01-04 06:46:37

字典功能（Dictionary）