速率说明
速率限制
1、什么是速率限制?
2、为什么会有速率限制
3、我们的API的限速具体数值
接口名 | chatcompletion(T2T-文本对话) | chatcompletion pro(T2T-文本对话) | Embeddings | T2A(语音生成) | T2A Stream(流式语音生成) | ||||
---|---|---|---|---|---|---|---|---|---|
模型 | abab5 | abab5.5 | abab5.5 | ||||||
客户类型 | RPM | TPM | RPM | TPM | RPM | TPM | RPM | RPM | RPM |
免费用户 | 6 | 12000 | 6 | 12000 | 6 | 12000 | 6 | 1 | 1 |
充值用户 | 120 | 360000 | 120 | 360000 | 120 | 360000 | 120 | 120 | 120 |
4、速率是如何被限制的?
5、如果遇到限速的报错返回会怎样?
6、速率限制和tokens_to_generate
7、如何更好的在限速策略下进行API的使用
8、如何提高速率限制
修改于 2024-01-03 06:13:50