推荐 endpoint
最小请求
cURL 示例
Python 示例
Node.js 示例
最佳实践
- 低延迟对话优先从
gemini-2.5-flash这类模型起步 parts结构保持独立,后续接图片、文件时不用重构请求模型- 如果你不需要额外思考成本,可以在 2.5 Flash 上把
thinkingBudget设成0
Gemini generateContent 的基础对话示例。
gemini-2.5-flash 这类模型起步parts 结构保持独立,后续接图片、文件时不用重构请求模型thinkingBudget 设成 0