MiniMax
  1. T2A Large API 接口
MiniMax
  • 公告通知
  • 产品定价
  • 概述
  • FAQ
  • 大模型介绍
    • 文本大模型
    • 语音大模型
  • 接入说明
    • 新手指南
    • 速率说明
  • 开发指南
    • 快速开始
  • 文本大模型接口
    • ChatCompletion Pro(对话)
      • 概述
      • ChatCompletion Pro API 文档
        • ChatCompletion Pro API
        • 示例对话功能
        • 限制返回格式功能(glyph)
        • 函数调用功能(function calling)
        • 插件功能(plugins)
        • 知识库检索功能(retrieval)
    • ChatCompletion(对话)
      • 概述
      • ChatCompletion 快速接入
      • ChatCompletion 调优指南
      • ChatCompletion API 文档
        • ChatCompletion API
        • 知识库检索功能(retrieval)
  • Assistants 接口
    • Assistants 操作指南
    • Assistans API 文档
      • Assistant
        • 创建 Assistant
        • 检索 Assistants
        • 删除 assistant
        • 查看 assistant 列表
      • Assistant File
        • 创建 assistant 文件
        • 检索 assistant 关联的文件
        • 列出 assistant 文件
      • Thread
        • 创建 thread
        • 检索 thread
      • Message
        • 创建 message
        • 检索 message
        • message 列表
      • Run
        • 创建 run
        • 检索 run
        • 列表 run
        • Submit tool outputs to run
      • Run Step
        • 检索 run step
        • 列表 run step
  • File(文档)
    • File(文档)
      GET
    • Upload 接口
      GET
    • Retrieve 接口
      GET
    • Delete 接口
      POST
    • RetrieveContent 接口
      GET
  • Retrieval(知识库检索)
    • 新建知识库
    • 删除知识库
    • 查看知识库详情
    • 查看知识库列表
    • 增加知识库文档
    • 删除知识库文档
    • 修改知识库文档
    • 查看知识库文档
    • 检索 Chatcompletion
    • 检索 Chatcompletion pro
  • 微调
    • Finetune 操作指南
    • Finetune API文档
      • 创建微调任务
      • 列出微调任务
      • 检索微调任务
      • 删除微调任务
      • 列出微调事件
      • 列举微调模型
      • 查询微调模型
      • 删除微调模型
  • 向量化
    • Embeddings(向量化)
  • 语音大模型接口
    • T2A (语音生成)
      • T2A 快速接入
      • T2A API 接口
        • T2A API接口
        • 字典功能(Dictionary)
    • T2A pro(长文本语音生成)
      • T2A Pro 快速接入
      • T2A Pro API 接口
      • 字典功能(Dictionary)
    • T2A large(异步超长文本语音生成)
      • T2A Large 快速接入
      • T2A Large API 接口
        • T2A Large API 接口
          GET
        • 字典功能(Dictionary)
          POST
    • T2A Stream(流式语音生成)
      • T2A Stream(流式语音生成)
      • 字典功能(Dictionary)
    • 快速复刻(Voice Cloning)
      • 上传文件
      • 音频复刻
  • 有声内容创作
    • Role Classification (文本角色分类)
      • 创建并异步运行角色识别任务
      • 查询角色识别任务
    • Role Audio Generation (角色音频生成)
      • 角色音频生成
  1. T2A Large API 接口

T2A Large API 接口

开发环境
http://dev-cn.your-api-server.com
开发环境
http://dev-cn.your-api-server.com
GET
/v1/t2a_async
该接口支持基于自然语言交互生成回复的能力。接口本身为无状态接口,即单次调用时,模型所接收到的信息量仅为接口传入内容,不涉及业务逻辑,同时模型也不存储您传入的数据。
该接口支持以下功能:
1、支持单次合成最高10000000(1000万)字符输入;
2、支持语调、语速、音量、比特率、采样率相关参数调整特性;
3、支持音频时长、音频大小等返回参数;
4、支持时间戳(字幕)返回,精确到句;
5、支持非法字符检测:非法字符不超过10%(包含10%),音频会正常生成并返回非法字符占比;非法字符超过10%,接口不返回结果(返回报错码),请检测后再次进行请求(非法字符定义:ascii码中的控制符(不含制表符和换行符));
提交长文本语音合成请求后,合成结果在提交之日次日起7天内完成(T+7),音频文件在服务端可保存7天
适用场景:整本书籍语音合成等
调用接口前请确认您的账号已经完成邮箱绑定,后续信息会以邮件的方式发送给您。

请求参数#

text字段备注
上传文件为压缩格式文件,压缩内文件支持TXT/json文件(压缩包内为同一格式文件)
json里会有三个字段,["title", "content", "extra"],分别是标题,正文,作者的话,需要产出三份结果,一共9个文件放在一个文件夹里。如果某字段不存在,或者内容为空,则不生成相应文件

返回参数#

语音合成完成后,会返回邮件至您账号绑定的邮箱,请通过邮件中接口进行下载,邮件中链接有效期为任务完成之日起7天(自然日),为了保证您的信息安全,每次点击后获取的下载链接有效期为1小时,请您在有效时间内进行下载,如因为特殊原因无法进行下载或下载失败请及时联系对应的商务经理或直接发送截图回复本邮件。如过期本次下载任务将失效,请您尽快完成下载。
返回文件备注
输入文件(压缩包内)字段输出文件备注
txt无音频mp3此文件的mp3文件
字幕json字幕json,精确到句
额外信息json参考下列字段
jsontitle音频mp3字段若或为空信息,则不产生相关内容,其他内容参考txt备注
字幕json
额外信息.json
content音频mp3
字幕json
额外信息json
extra音频mp3
字幕json
额外信息.json
json里会有三个字段,["title", "content", "extra"],分别是标题,正文,作者的话,需要产出三份结果,一共9个文件放在一个文件夹里。如果某字段不存在,或者内容为空,则不生成相应文件。
额外信息字段
参数语义类型备注
audio_length音频时长int64音频时长,精确到毫秒
audio_sample_rate采样率int64默认为24000,如客户请求参数进行调整,会根据请求参数生成
audio_size音频大小int64单位为字节
bitrate比特率int64默认为168000,如客户请求参数进行调整,会根据请求参数生成
word_count可读字数int64已经发音的字数统计(不算标点等其他符号,包含汉字数字字母)
invisible_character_ratio非法字符占比float64非法字符不超过10%(包含10%),音频会正常生成并返回非法字符占比;最大不超过0.1(10%),超过进行报错

请求失败#

参数语义类型备注
base_resp如果请求出错,对应的错误状态码和详情
base_resp.status_code状态码int641000,未知错误1001,超时1002,触发限流1004,鉴权失败1013,服务内部错误及非法字符超过10%2013,输入格式信息不正常
base_resp.status_msg错误详情string
请求示例请求示例
Shell
JavaScript
Java
Swift
curl --location -g --request GET 'http://dev-cn.your-api-server.com/v1/t2a_async?GroupId=${group_id}' \
--header 'authorization: Bearer ${api_key}' \
--form 'model="speech-01"' \
--form 'voice_id="female-tianmei"' \
--form 'text="/Users/minimax/Downloads/21622420008680404 3.zip"' \
--form 'speed="0.8"' \
--form 'vol="1"' \
--form 'pitch="1"' \
--form 'audio_sample_rate="32000"' \
--form 'bitrate="128000"'
响应示例响应示例
{
  "task_id": 70012586967104,
  "task_token": "eyJhbGciOiJSUzI1NiIsInR5cCI6IkpXVCJ9.eyJhdWQiOiIxNjg3MjU2NTE5MzAyNDcwIiwiaXNzIjoibWluaW1heCIsInN1YiI6IjcwMDEyNTg2OTY3MTA0In0.abCOG1YKiOU8ka2j2shb60ij8TeT0_9f751DHqbHXjQuEXh6i5pMayKchDUdI8l3-8TdbLoE2wFnLE7gWm7hT9M0-W9ayNm1YFQOmx1sRtDRUObOJp-Y8TUZGFewK0nakXH__F5XCVQYDtInAl-mvx8WI7XbDxFVTu0DWNUPcivd5GqEsr5B9nXj6kRciM5gKmEO_8uv8rzyXWceMpp9J15UFl29yERWdGNX8UfUmx4dSk_M8Z-5rTwEKt8ghb1Yp9QIa0Ier2zgYcxsgv1alRw9GlxVdPv6RMZfFidryENwko0p78g7UwV3x94xmcUMaaprKwJFy_yCCe2RnJVHxQ",
  "base_resp": {
    "status_code": 0,
    "status_msg": "success"
  }
}

请求参数

Query 参数
GroupId
string 
必需
示例值:
${group_id}
Header 参数
authorization
string 
必需
示例值:
Bearer ${api_key}
Body 参数multipart/form-data
model
string 
调用的模型版本
必需
示例值:
speech-01
voice_id
string 
请求的音色编号
必需
示例值:
female-tianmei
text
string 
可选
待合成的文本(打包上传,包里应只包含txt或json文件(压缩包内为同一格式文件))
示例值:
/Users/minimax/Downloads/21622420008680404 3.zip
speed
string 
可选
生成声音的语速(可选,默认值为1.0取值越大,语速越快)
示例值:
0.8
vol
string 
可选
生成声音的音量(可选,默认值为1.0取值越大,音量越高)
示例值:
1
pitch
string 
可选
生成声音的语调(可选,默认值为0(0为原音色输出,取值需为整数))
示例值:
1
audio_sample_rate
string 
可选
生成声音的采样率(可选,默认为32000)
示例值:
32000
bitrate
string 
可选
生成声音的比特率(可选,默认值为128000)
示例值:
128000

返回响应

🟢200成功
application/json
Body
task_id
integer 
任务ID
必需
task_token
string 
任务密钥
必需
base_resp
object 
必需
status_code
integer 
状态码
必需
0为成功
status_msg
string 
必需
上一页
T2A Large 快速接入
下一页
字典功能(Dictionary)
Built with