文本大模型
1、MiniMax文本模型介绍
基于MiniMax端到端自研多模态大语言模型,我们为企业用户或企业开发者提供功能丰富的API,适用于大多数文本处理场景。以自然语言交互的形式帮助企业用户或个人开发者提高文本相关的生产效率,例如:文本续写、文案生成、文本扩写、文本改写、内容摘要、代码生成、知识检索等。
MiniMax提供的API以极简的形式供企业客户和个人开发者调用,同时针对不同的行业及场景进行不同的能力抽象和封装,最大限度的降低使用者的开发复杂性,快速在目标场景中验证价值并进行生产部署。
1.1 标准化API接口服务
- Chat Completion:基于自然语言交互的文本生成能力接口;
- Chat Completion Pro:在Chat Completion的基础上提供了更多的功能,包括多人对话、对话示例,以及支持集合搜索引擎、调用自定义函数、限制返回格式辅助大模型返回更好的回复。
1.2 高阶能力介绍
Chat Completion Pro是我们推出最新的接口,它额外支持多角色设定及示例对话,并包括插件(plugins)、自定义函数调用(function call)、限制返回格式(glyph)等高阶功能。
- 示例对话功能(sample message):该功能可以通过示例对话的形式,帮助模型更好地理解用户想要获得的返回信息,包括但不限于信息内容,信息格式,信息回复方式等。
- 插件功能(plugins):该功能目前支持调用我们集成的搜索引擎生成内容 ,提供网络引擎检索的内容,辅助大模型生成结果。
- 函数调用(function call):该功能可调用自有函数生成内容 ,辅助大模型生成结果。可以帮助模型获取用户希望模型获取的相应信息,以使得模型返回更符合用户个人实际情况的内容。
- 限制返回格式(glyph):该功能可以帮助用户强制要求模型按照配置的固定格式返回内容。
2、价格及交付形态
价格
接口“Chatcompletion pro”和“Chatcompletion”,每1000token为0.015元。web search功能0.03元/次,开启plugin_web_search后,接口自动判断调用web search的次数
- 具体说明:收费模式包含输入和输出。1000个token约对应750个字符文本(包括标点等字符)
- 详细定价文档:https://api.minimax.chat/document/price?id=6433f32294878d408fc8293e
产品交付形态与特点
- 提供定制模型微调。可以根据客户要求构造定制数据集对预训练模型进行微调,支持多样化微调方式,满足客户的个性化需求。如需了解,请填写合作咨询:https://api.minimax.chat/cooperate
- 知识增强:搜索与知识图谱建立;
- 第三方生态开源:支持langchain、向量数据库对接丰富使用场景;
- 安全性:独立的安全审核模型,确保大模型输出安全、合法、合规。
进入“文本体验中心”,即可体验多行业多应用的场景示例,文本体验中心:https://api.minimax.chat/examination-center/text-experience-center
3、概念说明
3.1 大语言模型
大语言模型是一种大规模的、基于深度学习技术的自然语言处理模型,通过深度学习算法和模型架构,从数据中学习到语言的规律和特征,结合预训练技术进行大规模的训练,具备优秀的泛化性能和推理能力。大语言模型具有很强的语言理解和生成能力,可以让用户以自然语言的形式高效处理各种自然语言文本的任务。
3.2 Token
Token是指自然语言文本中的最小粒度单位,即一个最小的单词或符号。通常情况下,自然语言文本是由一个一个的Token组成的,每个Token都具备自己的词性、词义等属性。
补充说明:在训练大语言模型时,会使用一种称为“词向量”的技术,将每个token表示成一个向量形式,这个向量可以包含很多有用的语义信息,比如单词的词性、上下文等。模型通过这些向量来学习和理解自然语言文本,并能够完成各种任务。
在大语言模型处理任务的过程中,输入的文本会被转译为Token输入到模型中,而输出则是从Token转译到文本。输入Token与输出Token的长度直接影响了大语言模型所消耗的算力,所以业界通常采用基于Token数量的计费模式。
3.3 Prompt
在大语言模型中,Prompt通常是指一个用来提示模型完成某项任务的自然语言文本片段,在这些任务中,模型需要根据Prompt中的提示信息,生成符合预期的自然语言文本。
补充说明:Prompt通常由若干个Token组成,对应一个具体的任务或目标。例如:
- 对于一个问答任务,一个简单的Prompt可能是“请问一下这个问题的答案是什么?”
- 对于一个机器翻译任务,一个Prompt可能是“请将这句话翻译成中文”。
在这些prompt中,需要包含足够的提示信息,以引导模型完成任务。在具体的业务场景上,为了让模型的表现更加符合预期,Prompt往往会有衍生的语义。例如在对话场景上,往往会将背景设定单独称为Prompt。
3.4 调用频率限制(Rate Limit)
调用频率限制指的是基于商业策略的考量,对调用的频率进行限制的策略。
目前限制策略主要有以下维度:
- 基于请求次数的频率限制,按照基准时间不同,分为每秒限制请求次数(RPS)、每分钟限制请求次数(RPM)
- 基于Token数的频率限制,为每分钟限制Token总量(TPM)
3.5 API鉴权
MiniMax开放平台仅面向企业用户或个人开发者提供服务,使用者通过注册提交使用申请,由MiniMax对申请进行审核后开通相应的账号。使用者在获取账号登陆后,即可在个人信息页可以看到group_id和api密钥,在实际的接口调用中附上将group_id作为url参数附上,将API密钥作为请求头参数附上即可。
示例:
# groupid 作为url参数附在url之后, api密钥
curl --location '{url}?GroupId={group_id}' \
--header 'Autorization: Bearer {api密钥}' \
...