速率限制页用于说明调用 API 时应重点关注的吞吐与限流约束。Documentation Index
Fetch the complete documentation index at: https://docs.apigo.ai/llms.txt
Use this file to discover all available pages before exploring further.
你需要关注什么
- 单位时间请求数限制
- 并发请求限制
- 不同模型或能力是否有独立配额
- 是否区分免费层、测试环境和生产环境
工程建议
- 在服务端统一做重试、退避和熔断
- 对高频调用场景增加缓存或队列削峰
- 将业务峰值与模型调用峰值分离,避免前端直接放大流量
推荐排查顺序
- 先确认是否命中平台级限流
- 再确认是否命中具体模型或能力的速率上限
- 最后检查客户端是否存在异常重试或重复提交
