速率限制 - docs.apigo.ai

速率限制页用于说明调用 API 时应重点关注的吞吐与限流约束。

你需要关注什么

单位时间请求数限制
并发请求限制
不同模型或能力是否有独立配额
是否区分免费层、测试环境和生产环境

工程建议

在服务端统一做重试、退避和熔断
对高频调用场景增加缓存或队列削峰
将业务峰值与模型调用峰值分离，避免前端直接放大流量

推荐排查顺序

先确认是否命中平台级限流
再确认是否命中具体模型或能力的速率上限
最后检查客户端是否存在异常重试或重复提交

使用概述错误码查询